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本 书 是 写 给 普通 人 的 因果 逻辑 入 门 书 ， 旨 在 帮助 读者 培养 严谨 的 思维 方式 ， 





























在 不 借助 任何 专业 知识 的 前 提 下 ， 准 确定 位 
原因 的 理解 和 和 运用， 如 何 只 通过 观察 找到 原 
系 相关 实验 ， 如 何 利用 

















问题。 主要 内 容 包 括 : 认识 原 
因 ， 大 数据 集 与 原因 的 关系 ， 
因果 关系 来 制定 有 效 的 干预 措施 ， 研 究 因 果 关 系 的 意义 。 
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尽管 用 先进 的 计算 工具 很 容易 从 数据 中 找到 规律 ,但 是 最 深刻 的 认 
识 还 是 来 自 于 对 这 些 规律 来 源 的 把 握 ， 而 这 可 不 能 只 通过 计算 机 来 完成 。 





克 莱 因 伯 格 巧妙 地 向 读者 介绍 了 寻找 因果 关系 过 程 中 所 
和 方法 ， 思 路 清晰 且 内 容 实 用 ， 使 得 这 本 书 不 同 于 这 一 领 

















书 中 内 容 全 面 又 易于 理解 , 是 科研 领域 的 新 人 、 


























用 到 的 主要 概念 




















域 的 其 他 著作 。 





经 验 丰富 的 专家 以 及 其 他 


想 要 从 数据 中 获取 更 多 认 知 的 读者 的 必 读 之 物 。 
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哲学 、 经 济 学 、 统 计 学 以 及 届 辑 学 都 有 志 于 理 
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伯 格 成 功 地 将 这 些 完全 不 同 的 方法 以 一 种 简单 而 又 实用 的 方式 综合 在 了 


一 起 。 随 着 我 们 的 生活 越 来 越 多 地 “为 数据 所 对 
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个 清晰 的 思考 。 
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康 问题 以 及 我 们 周围 的 世界 ,就 必须 对 “从 观察 中 推理 因果 关系 ”有 一 


一 一 Chris Wiggins， 博 士 ,《 纽约 时 报 》 首 席 数 据 科 学 家 ， 
哥伦比亚 大 学 副教授 


因果 关系 是 生活 中 的 一 个 重要 特征 ， 但 是 人 们 对 它 有 着 大 量 争议 和 
误解 。 本 书 在 未 借助 任何 先 验 知识 或 专业 技术 的 前 提 下 , 对 因果 关系 做 出 
了 清晰 的 解释 , 并 且 通 俗 易 懂 、 妙 趣 横生 ,用 严密 的 钠 辑 和 深刻 的 分 析 来 











帮助 我 们 理解 复杂 的 概念 。 
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喝 咖 啡 会 使 人 长 寿 吗 ? 是 谁 把 流感 传染 给 你 的 ? 股票 价格 为 什么 会 
上 涨 ? 无 论 是 做 饮食 安排 还 是 投资 选择 ， 抑 或 是 责怪 某 人 毁 了 你 的 周末 ， 
你 都 需要 不 断 去 了 解 其 中 的 原因 。 正 是 这 种 因果 关系 在 帮助 我 们 预测 未 
来 , 解释 过 去 ,让 我 们 能 够 介入 其 中 并 对 事物 的 变化 产生 影响 。 与 流感 病 





人 接触 会 让 你 在 一 段 时 间 内 也 染 上 流感 , 知道 了 这 一 事实 , 你 就 能 知道 自 









































己 会 在 什么 时 候 出 现 流感 症状 。 针 对 性 很 强 的 游说 可 以 为 你 筹集 政治 竞选 
资金 , 了 解 了 这 一 关系 , 你 就 可 以 将 这 些 游 说 活动 视 为 增加 竞选 资金 的 一 

















个 可 行 方案 。 高 强度 运动 会 导致 高 血糖 ， 意 识 到 这 一 点 ， 你 就 可 以 帮助 
糖尿 病 患者 控制 血糖。 

尽管 推断 因果 关系 这 一 技能 非常 重要 ,但 你 之 前 可 能 没有 接触 过 这 
方面 的 课程 。 事实 上 , 你 可 能 都 未 曾 静 下 心 来 想 过 , 为 什么 某 件 事 会 成 为 
另 一 件 事 发 生 的 原因 。 虽 然 这 个 问题 的 答案 涉及 很 多 因素 ,但 从 根本 上 看 ， 
原因 可 以 提高 一 个 事件 发 生 的 概率 , 是 产生 某 种 结果 的 前 提 , 或 者 是 让 某 
件 事情 发 生 的 策略 。 但 是 , 不 能 因为 某 种 药物 会 引发 心脏 病 , 就 认为 某 个 
人 的 心脏 病 发 作 是 由 这 种 药物 引起 的 。 也 不 能 因为 某 个 地 区 在 缩小 班级 规 
模 以 后 , 学 生 的 成 绩 都 得 到 了 提高 , 就 认为 同样 的 做 法 在 其 他 地 区 也 会 产 
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BB 不仅 要 讨论 在 一 切 进展 顺利 的 情况 下 可 能 会 出 现 哪 些 
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结果 , 还 要 研究 为 什么 成 功 看 似 很 难 被 复制 。 除 此 之 外 , 我 们 还 要 考察 那 
些 在 理论 研究 中 经 常 被 忽视 的 实际 问题 。 

研究 因果 关系 的 方法 有 很 多 种 ( 有 些 是 互补 的 ， 有 些 是 对 立 的 )， 而 
且 涉 及 众多 领域 ( 包括 哲学 、 计 算 机 科学 、 心 理学 、 经 济 学 、 医 学 等 )。 
我 无 意 在 这 些 争辩 中 选择 立场 , 只 想 为 读者 呈现 各 种 观点 , 厘清 各 种 观点 
之 间 的 共识 与 分 歧 。 除 此 之 外 , 我 们 还 将 探讨 关于 因果 关系 的 心理 学 (人 
们 是 如 何 了 解 原 因 的 )、 如 何 进 行 因果 关系 的 实验 ( 以 及 这 些 实验 的 局 限 
性 是 什么 )， 以 及 如 何 根据 因果 关系 来 制定 相应 的 策略 〈 我 们 是 否 应 该 减 
少食 物 的 含 盐 量 ， 以 此 来 预防 高 血压 )。 

我 们 首先 要 型 清楚 什么 是 原因 ， 以 及 为 什么 我 们 常常 会 弄 错 事 情 发 
生 的 原因 (第 1~3 章 )。 然 后 , 要 认识 到 在 原因 的 理解 和 运用 方面 ,“ 什 么 
时 候 ” 与 “为 什么 ”同等 重要 (第 4 章 )。 接 着 ， 要 学 习 如 何 只 通过 观察 
就 找到 事情 发 生 的 原因 (第 5 章 )。 
大 型 数据 集 可 以 让 我 们 找到 事情 发 生 的 原因 ， 而 不 是 简单 用 来 检验 
我 们 的 假设 , 但 是 我 们 必须 认识 到 , 并 不 是 所 有 的 数据 都 能 用 来 推理 事件 
发 生 的 原因 。 在 第 6 章 , 我 们 将 考察 数据 特征 对 推理 的 影响 。 第 7 章 将 探 
索 在 可 以 做 实验 的 情况 下 ， 如 何 去 克 服 这 些 数据 特征 给 我 们 带 来 的 挑战 。 
这 里 所 说 的 实验 可 能 是 复杂 的 临床 试验 , 也 可 能 只 是 某 人 对 自己 不 同 锻炼 
计划 所 做 的 对 比 实验 。 通常 情况 与 个 别 情况 之 间 的 差异 , 正 是 我 们 需要 使 
用 专业 性 策略 对 各 种 事件 做 出 解释 的 原因 ( 第 8 章 讨 论 的 内 容 )。 但 是 ， 
要 想 利用 因果 关系 来 制定 有 效 的 干预 措施 , 如 在 菜单 上 提供 食品 热量 信息 
来 降低 肥胖 症 发 生 的 概率 , 就 需要 有 更 多 的 信息 , 而 且 很 多 干预 措施 还 可 
能 带 来 意 想 不 到 的 后 果 (第 9 章 将 详 述 这 一 点 )。 本 书 将 会 告诉 你 为 什么 
因果 关系 如 此 难 找 〈 比 报纸 文章 告诉 你 的 要 更 细致 、 更 复杂 )， 以 及 为 什 
么 尽管 如 此 ， 它 仍 是 一 个 相当 重要 且 广 泛 适用 的 话题 。 
虽然 困难 重重 ， 但 也 并 非 毫 无 希望 。 你 将 会 形成 一 3 
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考 体 系 : 要 问 的 问题 、 应 引起 怀疑 的 危险 信号 以 及 证 实 因果 关系 的 方法 。 
除了 帮 你 找到 事情 发 生 的 原因 以 外 , 本 书 还 能 帮 你 基于 因果 关系 来 做 出 决 
策 、 制 定 策略 ， 并 通过 进一步 测试 来 验证 你 找到 的 原因 。 

这 本 书 是 为 普通 读者 而 写 的 ， 我 并 未 假定 这 些 读者 具有 相关 的 背景 
知识 。 我 唯一 假定 的 是 读者 对 因果 关系 充满 好 奇 , 我 要 让 复杂 的 因果 关系 
变 得 通俗 易 懂 、 广 为 人 知 。 读 完 之 后 , 我 们 会 更 加 关注 人 们 的 直觉 以 及 如 
何 从 概念 上 理解 因果 关系 ， 而 不 是 数学 细节 (实际 上 , 本 书 不 会 介绍 任何 
数学 知识 )。 如 果 你 是 计算 机 科学 或 统计 学 博士 ， 也 许 会 学 到 一 些 新 的 工 
具 并 且 很 享受 在 其 他 领域 的 工作 之 旅 , 也 可 能 会 向 往 更 多 方法 论 方面 的 知 
识 。 不 过 ， 本 书 要 研究 的 只 是 普通 人 眼中 的 因果 关系 。 











































































































图 灵 社 区 会 员 ChenyangGao(2339083510@qq.com) EF 尊重 版 权 
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因果 关系 的 概念 以 及 寻找 因果 关系 的 方法 从 何 而 来 ? 





1999 年 ， 一 个 名 叫 Sally Clark 的 英国 律师 被 法 庭 判定 谋杀 了 她 的 两 
个 孩子 。1996 年 12 月 ,她 的 第 一 个 儿子 在 11 周 大 的 时 候 突 然 死亡 。 当 时 ， 
人 们 认为 孩子 是 自然 死亡 。 但 是 就 在 第 一 个 孩子 天 折 一 年 多 以 后 ，Clark 
的 第 二 个 儿子 又 在 8 周 大 的 时 候 死 亡 了 。 在 这 两 个 案件 中 ,两 个 孩子 似乎 
都 没有 什么 生理 上 的 疾病 。 于 是 ， 他 们 的 突然 死亡 引起 了 人 们 的 怀疑 。 

这 两 个 案件 有 很 多 共同 之 处 : 孩子 们 死 的 时 候 年 龄 差不多 ， 他 们 的 
死 都 是 由 Clark 发 现 的 ， 当 时 家 里 只 有 Clark 和 孩子 在 一 起 ， 而 且 验 尸 报 
告 表 明 两 个 孩子 身上 都 有 伤 。 一 开始 , 人 们 认为 第 一 个 孩子 的 伤 是 抢救 时 
造成 的 。 但 是 ,第 二 个 孩子 死 后 ， 人 们 对 孩子 的 伤 重新 做 了 检查 ， 而 这 一 
次 他 们 认为 这 些 伤 很 可 疑 。 第 二 个 孩子 死亡 四 周 后 , 警方 逮捕 了 和 孩子 的 父 
FE, BEE Clark 被 指控 为 谋杀 罪 并 获 刑 。 

同一 个 家 庭 的 两 个 婴儿 都 死 于 婴儿 猴 死 综合 征 (SIDS) 的 概率 有 多 
大 ? 据 英国 检察 官 称 , 发 生 这 种 情况 的 可 能 性 微乎其微 , 所 以 这 两 起 死亡 
一 定 是 谋杀 所 致 。 这 一 论据 (一 个 原因 的 可 能 性 几乎 为 零 ,所 以 一 定 还 有 
另外 一 个 原因 ) 造成 了 这 桩 著名 的 冤案 。 这 也 是 因为 统计 不 当 和 忽视 因果 
关系 而 造成 严重 后 果 的 一 个 重要 案例 。 

统计 学 家 和 因果 关系 研究 者 都 知道 这 个 案例 ， 其 主要 原因 在 于 ， 检 
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方 的 论据 本 质 上 基于 这 样 的 逻辑 : 被 告 的 辩 词 几乎 不 可 能 为 真 , 所 以 一 定 
是 假 的 。 检 方 为 此 请 来 了 一 位 专家 证 人 一 一 Roy Meadow 博士 。Meadow 
称 ， 同 一 个 家 庭 发 生 两 起 SIDS 事件 的 概率 为 七 千 三 百 万 分 之 一 。 检 方 由 
此 认为 ,因为 这 个 概率 非常 低 ,所 以 这 两 起 死亡 事件 不 可 能 出 于 自然 原因 ， 
一 定 是 谋杀 所 致 。 

然而 ， 这 一 统计 数据 完全 是 错误 的 。 即 使 这 个 数据 是 正确 的 ， 也 
不 应 该 这 样 用 。 有 一 份 研究 报告 估算 出 发 生 SIDS 的 概率 为 1/8543 。 
Meadow 根据 这 个 研究 报告 提出 : 同一 个 家 庭 发 生 两 起 SIDS 事件 的 概率 
为 1/(8543 x 8543)， 即 约 七 千 三 百 万 分 之 一 。 ' 这 种 计算 方法 错误 的 原因 
EF, 它 假定 这 些 事件 是 相互 独立 的 。 抛 硬币 的 时 候 , 无 论 硬币 落地 时 是 
正面 朝 上 还 是 反面 朝 上 , 都 不 会 对 下 一 次 结果 产生 任何 影响 。 因 为 每 一 次 
硬币 正面 朝 上 的 概率 都 是 /2， 所 以 将 第 一 次 正面 朝 上 的 概率 与 第 二 次 正 
面 朝 上 的 概率 相 乘 所 得 出 的 结果 就 是 连续 两 次 正面 朝 上 的 概率 , 这 从 数学 
角度 来 讲 是 没有 问题 的 。Meadow 当时 也 是 这 样 计算 的 。 

引发 SIDS 的 原因 还 不 确定 , 但 一 个 很 重要 的 影响 因素 是 孩子 所 处 的 
环境 〈 比如 家 里 是 否 有 人 吸烟 和 饮酒 )。 这 意味 着 ， 如 果 一 个 家 庭 发 生 过 
一 起 SIDS, 那么 这 个 家 庭 发 生 第 二 起 SIDS 的 概率 就 会 远大 于 1/8543, 
为 这 些 孩 子 的 生活 环境 和 遗传 基因 都 是 相同 的 。 也 就 是 说 , 第 一 起 死亡 事 
件 会 向 我 们 透露 第 二 起 死亡 事件 发 生 的 概率 。 这 个 案例 和 一 名 演员 获得 两 
次 奥斯卡 金 像 奖 的 情况 非常 相似 。 金 像 奖 并 不 是 随机 颁发 的 , 演员 第 一 次 
得 奖 时 有 具备 的 品质 ( 才华 、 知 名 度 、 人 脉 ) 会 提高 他 再 次 得 奖 的 可 能 性 。 

这 就 是 Clark 一 案 的 症结 所 在 。 在 这 个 案子 中 , 两 起 事件 并 不 是 相互 
独立 的 ,可 能 还 是 共同 的 原因 引发 的 。 因 此 , 不 能 通过 简单 的 乘法 来 计算 
这 两 起 事件 发 生 的 概率 。 相 反 , 在 计算 第 二 起 事件 发 生 的 概率 时 ， 应 该 考 
虑 到 第 一 起 事件 的 发 生 。 所 以 我 们 需要 知道 的 是 , 在 一 个 已 经 发 生 过 一 起 
SIDS 事件 的 家 庭 中 ， 发 生 第 二 起 SIDS 事件 的 概率 。 本 案 中 的 概率 在 计 
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算 和 使 用 方面 都 存在 十 分 严重 的 问题 , 为 此 , 被 告 在 第 一 次 上 诉 时 请 来 了 





一 位 统计 学 家 作为 专家 





对 这 个 案件 的 关心 。? 
不 过 此 案 的 问题 并 不 仅仅 是 误 算 概率 那么 简单 。 在 整个 案件 中 ， 检 





方 试图 将 事 人 


概率 等 同 于 

















Clark 无 罪 的 概率 。 这 种 错误 的 推理 











EA, 皇家 统计 学 会 还 专门 写 了 一 封 信 表 达 了 他 们 


F ( 即 这 两 起 SIDS 死亡 事件 ) 发 生 的 这 七 千 三 百 万 分 之 一 的 
将 事件 发 生 的 概率 当成 了 





被 告 有 罪 或 者 无 罪 的 概率 ， 这 就 是 我 们 所 说 的 检察 官 户 误 。” 
我 们 知道 ， 一 个 几乎 不 可 能 发 生 的 事件 真 的 发 生 了 。 一 个 家 庭 中 发 














生 两 起 SIDS 死亡 事件 的 可 能 怕 














很 小 ， 但 是 一 个 家 庭 中 两 个 婴儿 都 天 折 的 
可 能 性 也 很 小 。 人们 不 单单 会 考虑 SIDS 这 一 解释 是 否 合理 , 更 重要 的 是 ， 
他 们 会 将 其 与 关于 这 个 事件 的 其 他 解释 进行 比较 。 因 此 在 这 个 案件 中 , 最 




















好 将 同一 个 家 庭 中 两 个 孩子 都 被 谋杀 ( 检 方 的 假设 ) 的 可 能 性 与 同一 家 庭 
中 两 个 孩子 都 患 了 SIDS 的 可 能 性 进行 比较 。 
一 个 家 庭 中 两 个 孩子 都 死 于 SIDS 的 概率 与 这 两 个 孩子 都 感染 的 概率 
是 不 同 的 。 关 于 这 个 案件 我 们 还 有 其 他 的 证 据 ， 
必须 将 这 些 证 据 与 概率 结合 起 来 看 ( 比如 说 ,一 
没有 作案 机 会 或 者 没有 行凶 武器 ,那么 他 杀人 的 概率 肯定 要 低 于 总 谋 


AH) * 




















比如 物证 和 犯罪 动机 等 。 
个 人 如 果 没 有 犯罪 动机 、 





最 后 ， 无 论 一 件 事 情 发 生 的 概率 有 多 低 ， 只 要 尝试 的 次 数 足够 多 ， 
最 后 一 定 会 发 生 。Clark 一 案 中 ， 那 个 误 算 出 来 的 极 低 的 概率 (ETS 
万 分 之 一 ) 比 中 百 万 大 博彩 的 概率 ( 二 亿 五 千 八 百 万 分 之 一 ) 还 要 高 三 倍 


多 ,一 个 人 











FP 大 奖 的 概率 是 极 低 的 , 但 是 如 果 我 人 





门 说 某 个 地 方 的 某 个 人 会 














中 大 奖 ， 这 个 概率 又 如 何 呢 ? 那 就 高 得 多 了 。 这 就 说 明 , 仅 通过 概率 来 判 
断 一 个 人 的 清白 一 定 会 导致 一 些 和 冤案 。 这 是 因为 虽然 对 某 个 特定 的 家 庭 来 
说 ， 发 生 这 种 事件 的 可 能 性 很 小 ,但 是 世界 上 有 两 个 孩子 的 家 庭 有 上 百 万 








个 ， 这 种 事件 总 会 在 某 个 地 方 的 某 个 家 庭 发 生 。 
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寻 果 关系 简易 入 门 





2003 年 1 月 ，Clark 第 二 次 上 诉 时 终于 翻案 。 然 而 ， 那 时 她 已 经 在 监 
狱 服刑 三 年 了 。 





为 什么 Clark 案 会 成 为 因果 推理 失败 的 重要 案例 呢 ? 尽管 此 案 在 计算 


概率 的 过 程 














生 的 概率 来 支撑 某 个 特定 的 因果 结论 。 
多 大 ”， 当 你 在 说 服 别人 相信 某 个 因果 关系 时 ， 是 否 也 说 过 这 样 的 话 呢 ? 


生活 中 经 常 有 这 样 的 推 
见 了 ; 一 名 焉 师 知 道 你 最 喜欢 





人 证 记得 那 名 嫌犯 穿 的 是 一 件 红 色 法 兰 


大 可 能 发 生 ， 而 说 其 唯一 合理 























P 存 在 很 多 问题 , 但 最 根本 的 原因 是 , 此 案 试 图 用 一 个 事件 发 


“这 只 是 巧合 而 已 ” 


“这 个 概率 有 


M: 公司 来 了 一 名 新 员工 , 而 同一 天 你 的 订 书 机 不 
女性 亲属 的 名 字 以 “M” 开 头 ; 两 名 重要 

















Rel. 但 是 ,如 及 











aE 因 某 件 事情 不 
的 解释 就 是 因果 关系 ， 那 一 定 是 错误 的 。 
前 面 已 经 说 过 ， 一 个 不 大 可 能 发 生 的 事件 在 某 个 人 身上 发 生 的 概率 也 许 





极 低 ， 但 是 在 某 个 地 方 发 生 的 概率 却 不 低 。 除 了 会 造成 冤案 以 外 ， 错 误 

















的 因果 推 














理 还 可 能 会 带 来 其 他 严重 的 后 果 ， 比 如 将 大 量 的 时 间 和 精力 浪 


费 在 绝 不 可 能 起 作用 的 药品 上 ， 或 者 制定 一 些 无 用 的 、 代 价 高 昂 的 公共 


政策 。 





假设 、 衡 量 说 


的 目的 是 提高 读者 的 因果 推 下 


























F 据 、 分 析 各 种 说 辞 ,以 及 辨别 我 们 无 法 得 知事 情 发 生 原因 的 


情况 。 有 时 我 们 可 能 无 法 获得 足够 的 信息 来 建立 因果 联系 , 有 时 我 们 获得 


能 力 。 严 说 的 因果 














思维 是 指 质疑 




















的 信息 可 能 并 不 是 我 们 所 需要 的 , (A 





/ 

















EE 要 的 是 能 够 认识 到 这 些 问题 , 并 与 


其 他 人 就 这 些 问 题 进行 交流 。 通过 阅读 本 书 , 我 希望 读者 至 少 能 够 对 他 们 


所 听 到 的 各 种 因果 推论 多 一 些 质疑 〈 我 们 将 讨论 在 因果 推 























论 中 需要 注意 


哪些 危险 信号 ， 以 及 可 以 提出 哪些 问题 来 衡量 这 些 推论 )， 但 首先 我 们 会 
教 大 家 如 何 寻 找事 件 发 生 的 原因 、 如 何 为 因果 关系 提供 强 有 力 的 证 据 ,， 以 


及 如 何 使 




















用 因果 关系 来 指导 我 们 日 后 的 行为 。 
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1.1 何 为 原因 


试 着 花 点 时 间 ， 给 “原因 ”下 个 定义 。 

如 果 你 与 上 我 的 因果 关系 推理 课 的 学 生 一 样 ， 那 很 可 能 定义 下 到 一 
半 就 开始 用 各 种 可 能 的 异议 打 断 自己 了 。 也 许 你 用 了 “ 绝 大 多 数 时 候 ” 或 
“但 并 不 总 是 这 样 ”或 “只 有 ……” 这 样 的 字眼 来 限定 自己 的 定义 。 而 且 
你 的 定义 很 可 能 包括 一 些 特征 ， 比 如 : 原因 会 导致 某 种 结果 、 会 使 某 种 结 
果 更 有 可 能 出 现 、 具 有 产生 某 种 结果 的 能 力 ,或 者 会 形成 某 种 结果 。 这 些 
特征 体现 了 人 们 的 一 种 普遍 想法 : 事情 的 发 生 都 是 有 原因 的 , 否则 它 就 不 
会 发 生 。 

尽管 这 种 想法 并 不 适用 于 所 有 情况 ,但 在 本 书 中 ,“ 原 因 ” 一 词 一 般 
是 指 : 它 使 某 种 结果 更 有 可 能 出 现 , 并 且 没 有 它 某 种 结果 就 不 会 出 现 或 者 
无 法 出 现 ， 或 者 说 它 能 够 在 适当 的 环境 下 产生 茶 种 结果 。 

“原因 ”最 早 的 一 种 定义 来 自 亚 里 士 多 德 , 他 认为 原因 是 用 来 回答 “为 
什么 ”的 。 所以， 如果 我 们 问 为 什么 某 件 事 是 这 样 的 ， 人 们 可 能 会 解释 
这 个 现象 是 如 何 产生 的 〈 比 如 水 加 热 后 会 产生 蒸汽 )、 这 个 事物 的 成 分 是 
什么 〈 比 如 氧气 和 氧气 结合 会 形成 水 )、 这 个 事物 是 什么 样 的 ( 比如 椅子 
的 本 质 就 是 高 出 地 面 的 、 有 笔 背 的 、 用 来 让 人 举 的 东西 )， 或 者 为 什么 要 
做 这 件 事 〈 比如 疫苗 是 用 来 预防 疾病 的 )。 然而， 在 寻找 原因 的 时 候 ， 我 
们 想 了 解 的 是 为 什么 发 生 的 是 这 件 事 而 不 是 那 件 事 。 

尽管 继 亚 里 土 多 德 之 后 还 出 现 了 其 他 里 程 碑 式 的 成 就 ( 比如 13 世纪 阿 
奈奈 的 贡献 ), 然而 真正 的 巨大 飞跃 却 发 生 在 文艺 复兴 末期 的 科学 革命 时 
期 。 在 这 一 时 期 ,伽利略 、 和 牛顿 、 洛 克 等 人 都 取得 了 巨大 成 就 ,但 是 真正 
为 当今 因果 关系 思维 和 寻找 因果 关系 的 方法 论 芮 定 基础 的 是 18 世纪 的 大 
E Ri. CROP AEDT — URE RT, OTA OE Ae 
的 观点 甚至 信 他 所 信 , 而 是 说 他 以 一 种 批判 性 的 方式 重新 定义 了 这 个 问题 。 
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CRRA EH PETA ERRERA SRA”, Dk — Td el 
一 分 为 二 : 何 为 原因 ? 如 何 才能 找到 原因 ? 更 重要 的 是 , (RBA TK 
能 够 区 别 原因 与 非 原因 的 特征 , 而 是 从 本 质 上 将 二 者 的 关系 提炼 成 了 经 常 性 
事件 。 也 就 是 说 , 我 们 通过 经 常 性 地 观察 事件 发 生 的 规律 来 了 解 因果 关系 ， 
而 且 也 只 能 通过 经 历 这 些 有 规律 的 事件 来 了 解 原 因 。 

蚊虫 叮咬 是 传染 症 疾 的 必要 前 提 ， 但 春季 冰淇淋 小 贩 的 突 增 却 不 是 
天 气 变 暧 的 必要 前 提 。 然而 , 我 们 无 法 仅 通过 观察 就 找 出 经 常 性 事件 ( 天 
气 /冰淇淋 小 贩 ) 与 必要 性 事件 ( 蚊子 / 症 疾 ) 之 间 的 差异 。 只 有 在 出 现 反 
例 时 ， 比 如 天 气 已 经 变 暖 了 ， 而 冰淇淋 摊位 却 并 没有 增加 , 我 们 才能 了 解 
到 冰淇淋 小 贩 并 不 是 气温 变化 的 必要 条 件 。 
我 们 想当然 地 认为 原因 发 生 在 结果 之 前 ， 而 不 是 在 结果 之 后 或 与 结 
果 同 时 发 生 。 这 一 点 我 们 会 在 第 4 章 借用 物理 学 中 同时 性 因果 关系 的 例子 
来 进一步 讨论 。 此外, 我 们 还 需 关 注 一 些 原因 并 没有 在 结果 之 前 发 生 的 情 
况 。 具体 来 说 , 我 们 所 观察 到 的 事件 发 生 的 时 间 也 许 并 不 忠于 实际 上 事件 
发 生 的 时 间或 事物 之 间 的 联系 。 开 枪 时 , 我 们 先 看 到 的 是 枪 火 ， 然 后 才 会 
听 到 巨大 的 响声 。 因 为 我 们 总 是 先 看 到 枪 火 , 再 听 到 枪 声 ， 所 以 可 能 会 认 
为 是 枪 火 引起 了 枪 声 , 但 实际 上 枪 火 和 枪 声 都 是 开 枪 引起 的 。 只 有 研究 了 
这 两 个 事件 发 生 的 共同 原因 ， 我 们 才能 理解 这 种 规律 性 。 

很 多 情况 下 ， 我 们 可 能 无 法 在 事件 真正 发 生 之 时 对 其 进行 观察 ， 所 
以 即使 有 些 事件 其 实 是 有 先后 顺序 的 ， 但 它们 看 起 来 也 好 像 是 同时 发 生 
的 。 这 种 情况 经 常 出 现在 病历 中 : 病人 诉说 一 系列 症状 , 然后 医生 将 这 些 
症状 记 在 相应 的 药物 旁边 。 看 起 来 似乎 症状 .诊断 和 处 方 是 同时 发 生 的 
为 它们 都 是 在 看 医生 的 时 候 被 记录 的 )， 即 便 药 物 是 在 症状 出 现 之 前 服用 
的 ( 正 是 因为 用 药 出 现 了 症状 才 去 看 医生 的 )。 时间 也 有 可 能 是 错误 的 ， 
为 数据 并 不 是 在 事件 发 生 时 收集 的 , 而 是 事后 收集 的 。 如 果 我 问 你 上 次 
头疼 是 什么 时 候 , 除非 你 专门 做 了 记录 , 或 者 是 你 最 近 才 头疼 过 并 且 记 忆 
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犹 新 , 否则 你 回答 的 时 间 可 能 并 不 是 真正 准确 的 时 间 。 而 且 事 件 发 生 的 时 
间 越 入 ， 你 的 记忆 就 越 不 可 靠 。’ 然 而， 要 想 判断 一 种 药物 是 否 真 的 有 剖 
作用 ,事件 发 生 的 先后 顺序 是 最 关键 的 信息 之 

休 议 不 仅 要 求 原因 在 时 间 上 早 于 结果 ， 还 要 求 原因 和 结果 在 时 间 和 
空间 上 的 距离 都 要 相近 ( 相 邻 )。 如 果 它 们 在 时 间 和 空间 上 差 得 太 远 , 那 
我 们 将 很 难 发 现 它们 之 间 的 因果 关系 , 因为 很 多 其 他 因素 可 能 会 摊 杂 其 中 
并 对 结果 产生 影响 。 假设 一 个 朋友 借用 了 你 家 的 咖啡 机 , 在 她 归还 后 的 第 
三 个 月 你 发 现 机 器 坏 了 , 这 时 你 就 很 难 将 责任 归咎 于 你 的 朋友 。 但 如 果 她 
归还 机 器 的 时 候 你 就 发 现 机 器 坏 了 , 那 就 很 容易 将 责任 归咎 于 她 了 (事实 
上 ,心理 学 实验 也 通过 让 人 们 根据 两 个 事件 发 生 的 不 同时 间 差 来 推理 因果 
KA, 证 实 了 这 一 现象 *)。 同样 ， 如果 一 个 人 距离 书架 几 英 尺 远 , 而 男 一 
个 人 离 书架 的 距离 比 他 要 近 得 多 , 这 时 一 本 书 从 书架 上 掉 下 来 了 , 那么 站 
得 近 的 那个 人 更 可 能 是 引起 书本 掉 落 的 原因 。 类 似 地 , 台球 杆 击 中 台球 之 
后 ， 台 球 立 即 开 始 在 球 桌 上 滚动 ， 这 使 得 台球 与 球 杆 的 联系 明显 多 了 。 

休 席 要 求 原因 和 结果 在 时 空 上 具有 邻近 性 ， 然 而 有 些 因果 关系 却 并 
不 符合 这 一 要 求 。 这 就 限制 了 该 理论 的 适用 范围 以 及 我 们 进行 因果 推理 的 
能 力 。 比 如 说 , 某 种 因素 的 缺乏 会 导致 某 种 结果 , 就 像 缺 乏 维生素 C 会 导 
致 坏 血 病 。 这 一 因果 关系 就 不 符合 休 议 的 邻近 性 要 求 。 如 果 心 理 状态 ( 比 
如 信念 或 意图 ) 也 能 作为 原因 的 话 ， 那 么 我 们 就 又 得 到 了 一 种 因果 关系 ， 
这 种 因果 关系 的 因果 之 间 没 有 任何 物理 上 的 联系 。 比 如 说 ， 学 生 做 作业 
可 能 是 为 了 得 高 分 , 但 是 这 种 得 高 分 的 欲望 和 做 作业 的 行为 之 间 并 没有 物 
理 上 的 联系 。 还 有 一 些 时 间 跨 度 很 长 的 因果 事件 ,比如 因 环 境 因素 而 导致 
的 健康 问题 。 有 时 即使 这 些 事件 之 间 是 有 紧密 联系 的 , 我 们 可 能 也 不 会 注 
意 到 这 些 联系 。” 

按照 休 谎 的 理论 ， 如 果 我 们 多 次 在 看 到 有 人 按 蜂 鸣 器 之 后 听 到 声响 
(经常 性 联系 ), 就 会 由 此 推断 按 蜂 鸣 器 会 导致 这 种 声响 。 之 所 以 如 此 推断 ， 
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寻 果 关系 简易 入 门 








是 因为 我 们 看 到 人 的 手指 接触 到 了 ( 空间 邻近 性 ) 按钮 ， 而 接触 按钮 的 行 








为 发 生 在 声响 之 前 ( 时序 性 )， 而 ] 


























昌 在 手指 接触 按钮 后 几乎 立即 ( 时 间 邻 
近 性 ) 产生 了 声响 。 相 反 ， 如 果 这 两 件 事 之 间 有 很 长 的 延迟 , 或 者 这 两 件 
事 同时 发 生 , 或 者 蜂 鸣 器 并 不 是 每 次 都 会 发 出 声响 , 那 我 们 就 不 能 做 此 推 





WT o 我 们 不 能 说 按 下 按钮 是 发 出 声响 的 必要 条 件 ,只 能 说 我 们 多 次 看 到 





这 一 事件 。 关 于 这 方面 








引用 这 个 案例 主要 是 为 了 区 分 : (1) 
(2) 事物 之 间 的 潜在 关系 是 什么 ， 








的 知识 还 有 很 多 , 我 们 将 在 第 5 章 详细 讨论 。 在 此 





E 某 种 结果 的 必要 条 件 和 伴随 条 件 ; 
以 及 我 们 能 够 通过 观察 学 到 些 什么 。 




















值得 注意 的 是 ， 并 不 是 所 有 人 都 赞成 休 资 的 观点 ， 尤 其 是 康德 。 众 

































































所 周知 , 康德 不 赞成 休 并 把 因果 关系 简化 为 规律 , 他 认为 必然 性 是 因果 关 
系 的 基本 特征 , 而 且 由 于 我 们 无 法 赁 经 验 推理 出 事物 之 间 的 必然 联系 , 也 
就 无 法 通过 观察 归纳 出 事件 发 生 的 原因 。 相 反 , 他 认为 我 们 可 以 用 一 种 先 
验 知识 去 阐释 我 们 所 观察 到 的 因 曙 

















关系 o 3 


尽管 大 部 分 有 关 因 果 关 系 的 定义 都 是 基于 休 谎 的 理论 建立 的 ,但 是 
没有 任何 一 个 定义 能 够 包含 所 有 可 能 出 现 的 情况 , 每 一 个 定义 都 有 其 他 定 


义 所 没有 的 例外 情况 。 比 如 说 , 某 种 药物 可 能 只 会 在 个 别 患者 身上 出 现 副 





























作用 ( 所 以 我 们 不 能 假定 某 个 原因 必然 会 产生 某 种 结果 ); 安全 带 一 般 可 
以 防止 交通 事故 中 的 死亡 事件 ， 但 在 有 些 情 况 下 却 可 能 会 引发 死亡 事件 
《所 以 我 们 需要 想到 有 些 因 素 在 不 同 环境 下 可 能 会 产生 不 同 的 结果 )。 
结 为 : 我 们 应 该 将 原因 视 为 这 个 世界 的 基石 或 原始 
力量 ( 这 种 东西 无 法 简化 为 任何 定律 ), 还 是 我 们 强加 给 事物 的 一 种 结构 ? 
人 们 对 因果 关系 的 方方面面 都 存在 不 同 的 见解 , 这 一 问题 也 不 例外 ( 人 们 





这 个 问题 常 被 归 






























































甚至 对 “ 某 些 特定 的 理论 是 否 能 与 因明 
有 些 人 认为 ,原因 如 此 难 




















实在 论 的 概念 兼容 ”也 各 执 己 见 )。 
找 ， 我 们 根本 不 可 能 找到 , 甚至 觉得 那些 物理 学 
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定律 都 比 原因 有 用 得 多 。 也 就 是 说 ， 他 们 认为 “原因 ”只 是 “引发 ”“ 推 
动 "“ 抵 制 ”“ 阻 止 ”这 类 词 的 简约 表达 ， 而 不 是 一 个 基本 的 概念 。” 

因果 关系 在 日 常生 活 如 此 重要 ， 但 在 哲学 上 却 没有 一 个 公认 的 关于 
因果 关系 的 理论 , 也 没有 什么 万 无 一 失 的 计算 方法 能 帮助 我 们 准确 找到 因 
RRA, 这 让 人 有 点 惊讶 。 但 更 琼 手 的 是 , 由 于 人 们 对 “原因 ”的 定义 不 
E, 所 以 同一 情况 下 ， 人 们 可 能 会 将 不 同 的 因素 视 为 事件 发 生 的 原因 , 但 
事件 的 真相 可 能 并 没有 人 知道 。 

比如 说 ， 饱 勃 遭 遇 了 抢劫， 而 且 劫 匪 想 要 杀人 灭口 。 但 在 抢劫 的 过 
程 中 , 鲍 勃 心脏 病 突 发 ， 随 后 死亡 。 我 们 可 以 将 鲍 勃 的 死因 归咎 于 生理 机 
制 〈 心 脏 病 发 作 )， 并 进一步 追溯 到 心脏 病 的 根源 一 一 遗传 基因 ， 这 种 基因 
大 大 增加 了 心脏 病 突 发 致死 的 概率 。 或 者 将 鲍 勃 的 死因 归咎 于 抢劫 事件 ， 
为 如 果 没 有 遭遇 抢劫 , 饱 勃 的 心脏 病 就 不 会 发 作 。 这 两 种 死因 都 解释 得 
通 , 我 们 无 法 立即 搞 清楚 哪个 解释 更 合理 , 或 者 它们 只 是 对 一 个 事件 的 两 
种 分 析 。 此 外 , 不 要 试图 为 事件 找 出 某 个 唯一 的 原因 。 也 许 是 心脏 病 发 作 
和 抢劫 事件 共同 导致 了 鲍 勃 的 死亡 , 这 两 个 事件 的 影响 是 不 可 分 割 的 。 在 
第 8 章 和 第 9 章 中 , 我 们 将 再 次 分 析 这 两 件 事 对 鲍 勃 的 死亡 所 应 承担 的 责 
任 , 并 研究 一 些 事件 发 生 的 原因 ( 比如 为 什么 会 爆发 某 场 战 争 ) 以 及 某 些 
政策 是 否 有 效 ( 比如 禁止 在 酒吧 吸烟 的 政策 是 否 改善 了 纽约 市 的 人 口 健康 
状况 )。 

尽管 原因 不 易 寻 找 又 难以 界定 ， 但 也 不 是 毫 无 希望 。 答 案 并 不 像 人 
们 想象 的 那么 清楚 明了 ( 我 们 没有 神奇 宝 盒 , 不 能 从 这 头 输入 数据 然后 等 
它 自 动 输出 原因 ， 并 且 输 出 绝对 正确 、 万 无 一 失 )， 我 们 的 大 部 分 工作 只 
是 找 出 何 时 该 用 何 种 方法 。 关于 原因 的 定义 有 很 多 不 同 的 观点 , 这 些 观点 
给 我 们 提供 了 很 多 种 方法 , 这 些 方法 或 多 或 少 都 有 点 用 , 只 是 工作 原理 和 
适用 的 情形 有 所 不 同 。 如 果 能 了 解 其 中 两 种 或 以 上 的 方法 , 并 且 了 解 它们 
之 间 是 如 何 互 补 的 , 那么 我 们 就 能 以 多 种 方法 来 考察 同一 种 情形 了 。 有 些 
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方法 适用 的 情形 可 能 比较 多 ( 或 者 适用 于 对 我 们 而 言 很 重要 的 一 些 情形 )， 
但 是 请 记 住 , 没有 哪 种 方法 是 十 全 十 美的 。 尽管 寻找 原因 很 难 , 但 一 定 要 
坚持 不 懈 地 去 寻找 正确 的 原因 。 如 果 能 够 坦然 接受 我 们 可 能 会 犯错 的 事 



































实 , 并 且 明 
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在 何 时 能 够 找到 什么 , 那么 我 们 就 可 以 不 断 地 尝试 , 看 看 这 





些 方 法 都 能 适用 于 哪些 情形 , 至 少 能 准确 地 描述 出 我 们 所 使 用 的 方法 以 及 
所 得 到 的 结果 。 本 书 重 点 阐述 了 各 种 方法 的 优势 和 局 限 性 , 而 不 是 向 读者 





























种 方法 要 视 情 况 而 定 。 























推荐 某 些 方法 , 因为 这 些 方法 都 不 是 绝对 的 。 数据 不 全 时 可 能 这 种 方法 更 
有 效 , 事件 发 生 的 时 间 很 重要 时 可 能 那 种 方法 更 有 效 , 总 之 , 具体 使 用 哪 




















因果 思维 对 科学 、 法 律 、 医 学 和 其 他 领域 (很 难 想 出 有 哪 一 个 学 科 














不 关心 或 者 不 需要 找到 事件 发 生 的 原因 ) 都 至 关 重要 ,但 其 缺陷 之 一 在 于 ， 























用 来 描述 原因 的 语言 和 用 来 寻找 原因 的 方法 可 能 过 于 专业 化 ， 并 且 让 人 








感觉 它 只 局 限于 特定 领域 。 你 可 能 觉得 神经 学 和 经 济 学 之 间 没 什么 共同 


r 


i， 也 不 认为 计算 机 科学 能 够 解决 心理 学 问题 ， 


但 这 些 不 过 是 新 兴 的 、 跨 











一 样 的 。 


1.2 怎样 才能 找到 原因 




















学 科研 究 因 果 关 系 的 一 部 分 领域 。 然 而 , 所 有 的 领域 在 哲学 上 的 起 源 都 是 





哲学 家 们 长 期 以 来 一 直 在 关注 “原因 究竟 是 什么 ”这 个 问题 ， 但 是 
界定 因果 关系 的 主要 哲学 方法 以 及 我 们 今天 用 来 从 数据 中 寻找 因果 关系 
的 计算 方法 ， 却 直到 20 世纪 七 八 十 年 代 才 出 现 。 我 们 不 知道 将 来 是 否 会 
出 现 一 个 公认 的 因果 关系 理论 , 但 我 们 有 必要 了 解 这 个 广泛 使 用 的 概念 的 
含义 , 只 有 这 样 才能 更 清晰 地 对 它 进行 思考 和 讨论 。 我 们 在 因果 关系 研究 
领域 所 取得 的 任何 进步 都 会 对 计算 机 科学 以 及 其 他 领域 产生 广泛 的 影响 。 












































假如 原因 不 仅 是 一 种 事物 , 那么 我 们 可 能 就 要 



































用 多 种 方法 去 寻找 它 、 描 述 
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， 并 且 用 不 同 的 实验 来 验证 人 们 关于 原因 的 直觉 。 

自 休 谎 以 来 ， 因 果 关 系 研究 领域 所 面临 的 主要 问题 是 : 我 们 该 如 何 
区 分 包含 因果 关系 的 事件 和 不 含 因果 关系 的 事件 。20 世纪 六 七 十 年 代 出 
现 了 三 种 主要 的 研究 方法 , 都 建立 在 休 议 的 理论 基础 之 上 。 单一 的 原因 不 
太 可 能 引起 某 种 结果 ， 所 以 John L. Mackie 提出 了 一 个 理论 ， 他 认为 某 种 
结果 的 产生 是 由 一 系列 条 件 共同 导致 的 。 “这 一 理论 很 好 地 为 我 们 排除 了 
不 包含 因果 关系 的 事件 ,并 且 解 释 了 原因 的 复杂 性 。 类 似 地 , 许多 因果 关 
系 都 包含 偶然 性 因素 , 在 这 类 情况 下 , 原因 可 能 只 是 提高 了 某 种 结果 出 现 
的 可 能 性 ， 但 并 不 保证 它 一 定 会 出 现 。 针 对 这 一 特征 ，Patrick Suppes 及 
其 他 研究 者 们 提出 了 概率 法 。” 休 资 的 理论 还 促成 了 反 事 实 推理 法 : 通 
过 假设 导致 某 件 事 的 原因 不 存在 , 事情 的 发 展会 有 何不 同 , 从 而 来 界定 这 
一 事件 发 生 的 原因 。 ”比如 说 ， 某 个 人 是 赢得 一 场 比赛 的 主要 原因 ， 因 为 
如 果 没 有 他 ， 这 场 比赛 就 不 会 赢 。 
哲学 上 的 这 些 方法 似乎 已 经 脱离 了 寻找 因果 关系 的 计算 方法 ， 但 这 
些 不 同 的 因果 思维 却 能 为 我 们 提供 许多 方法 去 寻找 因果 关系 的 证 据 。 对 于 
计算 机 科学 家 来 说 ,人 工 智 能 的 梦想 之 一 就 是 实现 自动 推理 。 要 做 到 这 一 
点 ,关键 之 一 在 于 找到 事件 发 生 的 各 种 原因 ,并 利用 它们 来 形成 各 种 解释 。 
这 项 工作 在 现实 生活 中 得 到 了 广泛 的 应 用 , 从 机 器 人 的 生产 (机 器 人 需要 
使 用 现实 世界 的 各 种 模型 来 计划 自己 的 行为 , 并 预测 这 些 行 为 的 结果 ) 到 
广告 宣传 (亚马逊 如 果 知 道 你 点 击 “ 现 在 购买 ”按钮 的 原因 ， 就 能 向 你 推 
荐 更 适合 你 的 商品 ) 再 到 医疗 服务 ( 重症 监护 病房 里 的 患者 的 身体 状况 突 
然 发 生变 化 时 ， 会 向 医生 发 出 警报 )。 然 而 ， 要 想 制定 出 算法 ( 解决 问题 
的 一 系列 步骤 )， 我 们 需要 对 问题 进行 精准 的 描述 。 要 想 设计 出 能 够 找到 
原因 的 计算 机 程序 ， 我 们 需要 对 原因 进行 定义 。 

20 世纪 80 年代 ,以 Judea Pearl 为首 的 计算 机 科学 家 们 向 人 们 证 实 了 ， 
以 概率 来 定义 因果 关系 的 哲学 理论 可 以 用 图 表 来 表示 。 这 些 图 表 可 以 向 人 
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12) 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 


























们 直观 地 呈现 出 事件 之 间 的 因果 关系 , 并 为 人 们 提供 了 针对 不 同 变量 之 间 
的 数学 关系 进行 编码 的 方法 。 更 重要 的 是 , 他 们 还 引入 了 一 些 根据 先 验 知 
识 来 构建 图 表 以 及 从 数据 中 寻找 它们 的 方法 。” 这 就 为 我 们 带 来 了 很 多 新 
的 问题 。 如 果 因 果 事 件 之 间 存 在 可 变 延迟 , 那 我 们 还 能 找到 因果 关系 吗 ? 
如 果 因 果 关 系 本 身 会 随 着 时 间 而 发 生 改 变 , 那 我 们 能 从 中 学 到 什么 ? 计算 
机 科学 家 们 设计 了 一 些 能 够 自动 寻找 事件 的 解释 的 方法 , 以 及 测试 这 些 解 
释 是 否 符合 实际 的 方法 。 尽管 我 们 在 过 去 的 几 十 年 里 取得 了 很 多 成 就 , 但 
是 依然 面临 着 许多 挑战 , 尤其 是 我 们 对 数据 的 依赖 程度 已 经 越 来 越 高 。 我 
们 现在 所 面临 的 不 是 那些 为 了 研究 而 精心 挑选 出 来 的 数据 集 ， 而 是 海量 
的 、 不 明确 的 、 根 据 观察 得 到 的 数据 。 想 象 我 们 正面 临 这 样 一 个 简单 的 问 
题 : 根据 Facebook 数据 了 解 人 们 的 人 际 关 系 。 第 一 个 困难 是 ， 并 不 是 所 
有 人 都 使 用 Facebook。 所 以 ,我 们 只 能 通过 Facebook 研究 一 部 分 人 的 人 
际 关系 。 这 部 分 人 也 许 并 不 能 代表 所 有 人 , 也 不 能 代表 你 感 兴趣 的 某 一 类 
人 。 此 外 ， 人 们 使 用 Facebook 的 方式 也 不 尽 相 同 。 有 些 人 从 来 不 会 显示 
他 们 的 人 际 关 系 , 有 些 人 可 能 会 显示 虚假 的 人 际 关系 , 还 有 些 人 可 能 不 会 
及 时 更 新 他 们 的 个 人 信息 。 

在 因果 推理 过 程 中 ， 尚 未 解决 的 关键 问题 包括 : 从 不 明确 的 或 缺少 
变量 和 未 经 观察 ( 如 果 我 们 没有 观察 吸烟 这 个 变量 , 是 否 会 错误 地 把 其 他 
因素 当 作 引起 肺癌 的 原因 ) 的 数据 中 寻找 事件 的 原因 , 寻找 事件 之 间 的 复 
杂 关 系 〈 如 果 这 个 结果 是 一 系列 事件 共同 导致 的 呢 )， 以 及 寻找 偶发 事件 
的 原因 和 结果 (是 什么 导致 了 2010 年 股市 的 闪电 前 盘 )。 

有 趣 的 是 ， 电 子 健康 记录 等 海量 数据 正 将 流行 病 学 与 健康 计算 工作 
相 结合 ， 以 了 解 影响 人 口 健 康 的 因素 。 我 们 的 研究 是 先 了 解 影响 健康 的 
因素 , 然后 利用 这 些 知识 来 指导 公共 健康 干预 措施 , 而 大 量 人 口 的 长 期 健 
康 数 据 (他 们 的 诊断 、 症 状 、 用 药 情况 、 所 接触 的 环境 等 ) 对 研究 有 莫大 
的 帮助 。 我 们 面临 着 双重 挑战 一 一 研究 设计 (流行 病 学 的 一 贯 研究 重点 ) 
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并 从 大 型 数据 集 ( 计算 机 科学 的 主要 焦点 ) 中 进行 高 效 且 准确 的 推理 。 
由 于 流行 病 学 的 研究 目标 比较 特殊 , 所 以 它 在 设计 方法 以 寻找 原因 方面 有 
着 很 长 的 历史 ， 从 James Lind 随机 检查 水 手 来 寻找 坏 血 病 的 病因 “， 到 
John Snow 发 现 被 污染 的 水 泵 是 导致 伦敦 霍乱 疫情 的 一 个 原因 “, 到 Koch 
提出 的 假设 在 细菌 和 肺结核 之 间 建 立 了 因果 关系 “， 再 到 Austin Bradford 
Hill 将 吸烟 和 肺癌 联系 在 了 一 起 , 并 为 人 们 评估 因果 关系 提供 了 一 些 指导 
原则 。” 
医学 研究 也 比 以 前 更 加 依赖 数据 了 。 各 大 医院 和 私人 诊所 都 在 将 病 
人 的 病历 从 纸 质 图 表 转 换 为 电子 格式 , 但 这 种 转换 工作 必须 满足 有 意义 的 
使 用 标准 〈 比如 能 够 利用 数据 来 帮助 医生 诊断 病情 )， 它 所 带 来 的 好 处 要 
能 够 抵消 转换 工作 所 消耗 的 成 本 。 然 而 要 想 满足 这 些 标准 , 很 多 工作 都 要 
进行 海量 的 数据 分 析 ， 这 就 需要 使 用 计算 方法 。 

神经 科学 家 可 以 通过 脑 电 图 措 记 器 和 功能 磁 共 振 成 像 仪 来 收集 有 关 
大 脑 活动 的 海量 数据 , 并 利用 计算 机 科学 和 经 济 学 的 研究 方法 来 分 析 这 些 
数据 。 脑 电 图 中 的 数据 本 质 上 就 是 大 脑 活 动 的 量化 数字 记录 , 这 种 记录 在 
结构 上 和 股市 数据 差不多 ( 股市 数据 可 以 告诉 我 们 随 着 时 间 的 变化 , 股票 
的 交易 价格 和 交易 量 是 多 少 )。Clive Granger 提出 了 经 济 时 间 序 列 中 的 因 
果 关 系 理论 ( 他 因此 获得 了 诺 贝 尔 奖 )， 这 一 理论 不 仅 适 用 于 经 济 学 ， 还 
被 应 用 于 其 他 生物 学 数据 ， 如 基因 表达 阵列 〈 用 来 测量 随 着 时 间 的 变化 ， 
基因 的 活跃 程度 如 何 )。” 

经 济 学 中 的 一 个 关键 挑战 是 ， 判 断 执行 某 个 政策 是 否 能 实现 预期 的 
目标 。 这 与 公共 健康 领域 所 关注 的 问题 十 分 类 似 ， 比 如 判断 是 否 可 以 通过 
减少 苏打 水 的 瓶 身 容量 来 减轻 肥胖 症 问 题 。 这 个 问题 也 是 我 们 所 面临 的 最 
难 解 决 的 问题 之 一 。 在 很 多 情况 下 ,所 颁布 的 政策 本 身 就 会 改变 社会 的 体 
制 。 我 们 会 在 第 9 章 看 到 这 样 一 个 例子 : 田纳西 州 最 初 做 了 一 个 缩小 班级 
规模 的 实验 , 于 是 加 州 用 一 种 十 分 仓促 的 方式 也 缩小 了 班级 规模 , 但 这 两 
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果 关 系 简 易 入 门 








个 事件 的 结果 截然 不 同 。 如 果 所 有 条 人 
来 积极 的 影响 , 但 也 可 
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各 究 竞 是 好 是 坏 , 以 及 在 交通 事故 死 1 
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法 规 还 是 进一步 完 
对 于 心理 学 家 来 说 ， 


除 这 
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也 想 知道 人 们 为 什么 会 做 出 各 种 行为 ， 尤 





善 它 。 


SH pe DS] AR THE A 
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间 的 差异 ,以 及 它 何 时 会 出 错 ) 是 理解 人 类 行为 的 关键 之 一 。 经 


不 变 的 话 , 那么 一 项 干预 政策 可 


改变 人 们 的 行为 。 如 果 要 求人 们 系 安 全 
的 法 规 会 导致 人 们 开车 时 更 加 鲁莽 , 那么 我 们 就 很 难 了 解 这 个 法 规 的 影 
广 率 不 降 反 升 的 情况 下 , 到 底 是 要 废 





(包括 它 的 发 展 过 程 ， 人 与 动物 


济 学 家 

















其 是 在 做 决策 的 过 程 中 。 最 近 ， 











心理 学 家 和 哲学 家 共同 利 


于 实验 哲学 的 研究 范畴 ”)。 一 个 很 关键 的 问题 在 于 ， 要 到 
道德 评判 之 间 的 关系 。 如 果 有 人 在 资助 申 
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[ 究 人 们 对 因果 关系 的 直觉 ( 这 属 
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请 中 杜撰 数据 并 因此 获得 了 资 





B, 而 其 他 诚实 可 敬 的 科学 家 们 却 因为 资助 资金 有 限 而 没有 获得 资助 , 那 
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1.3 为 什么 需要 


原因 


门 能 说 是 那个 欺骗 者 导致 他 们 没有 获得 资助 吗 ? 现 在 有 两 个 问题 : 应 
网 骗 者 吗 ? 如 果 所 有 人 都 存在 欺骗 行为 , 那么 我 们 对 这 件 事 的 
发 生 改 变 呢 ? 要 了 解 人 们 是 如 何 做 出 因果 关系 判断 的 , 这 不 仅 
帮助 我 们 更 好 地 理解 人 们 的 思维 方式 ， 还 能 帮助 我 们 处 理 一 些 实际 问 
， 比 如 解决 分 歧 、 提 升 教育 和 培训 水 平 ”以 及 保证 陪审 团 
诉 大 家 , 虽然 我 们 无 法 消除 所 有 导致 偏见 和 错误 的 因素 , 但 可 以 更 
也 发 现 这 些 因素 并 了 解 它们 可 能 会 带 来 的 影响 。 











的 公正 性 。 本 





原因 难以 界定 又 不 易 寻 找 ， 那 么 它们 对 我 们 究竟 有 什么 好 处 呢 ? 我 





们 又 为 什么 需要 它们 呢 ? 有 三 件 很 重要 的 事 只 有 在 


清楚 


原因 的 情况 下 才 


能 做 到 ， 或 者 做 到 最 好 ， 这 三 件 事 是 : 了 预测、 解释 和 干预 。 





首先 ， 假 设 我 们 想 要 预测 谁 会 赢得 美国 总 统 大 选 。 专 家 们 找到 了 各 
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种 规律 ,比如 共和 党 人 必须 赢得 俄亥俄 州 的 选票 才能 说 得 大 选 ; 自 富 兰 克 
PK 罗斯 福 之 后 ， 没 有 任何 一 位 总 统 能 够 在 失业 率 超过 7.2%” 时 获得 连 
任 ; 美国 从 来 没有 女性 总 统 ( 至 少 在 我 写作 本 书 时 是 这 样 的 )。 ”然而 这 
些 只 是 规律 而 已 。 我 们 可 以 在 历任 总 统 身上 找到 很 多 这 样 的 规律 , 但 是 我 
们 无 法 从 中 得 知 他 们 为 什么 会 赢得 大 选 。 人 们 是 根据 失业 率 投票 的 吗 ? 还 



























































是 说 失业 率 只 是 间接 反映 了 国家 形势 和 经 济 状 况 , 暗示 人 们 在 失业 率 高 的 
时 候 要 寻求 变革 ? 更 糟糕 的 是 ,如果 我 们 发 现 的 这 些 规 律 只 是 巧合 , 那么 
它们 最 终 都 会 被 打破 。 而 且 , 这 些 数据 是 从 很 小 的 数据 集中 得 出 的 ; 美国 
































历史 上 只 有 44 位 总 统 ， 其 中 连任 的 总 统 还 不 到 一 半 。 








这 就 是 黑 盒 问题 : 我 们 把 数据 输入 黑 盒 子 ， 然 后 从 中 得 出 一 些 预 测 ， 
但 是 黑 盒 子 不 会 对 这 些 预测 做 出 任何 解释 , 也 不 会 告诉 我 们 这 些 预 测 为 什 
么 值得 信赖 。 如 果 我 们 不 知道 这 些 预测 为 何 会 成 真 ( 为 什么 赢得 某 个 州 的 























选票 就 能 赢得 大 选 )， 也 就 无 法 预料 它们 的 失败 。 如 果 我 们 知道 俄 交 俄 州 
能 够 “决定 ”一 场 大 选 的 原因 是 这 个 州 的 人 口 特征 十 分 具有 代表 性 , 而 且 
这 个 州 从 来 不 专属 于 某 一 个 政党 , 那么 我 们 就 能 由 此 预测 。 如果 由 于 移民 
人 口 导致 俄 辫 俄 州 的 人 口 组 成 发 生 了 巨大 变化 , 那么 之 前 的 预测 一 一 它 对 
大 选 有 决定 性 作用 一 一 也 就 不 复 存 在 了 。 如 果 这 个 州 只 是 反映 全 国 总 体 趋 
































势 的 一 个 间接 指标 , 那 还 可 以 通过 全 国民 意 调查 来 获得 更 直接 、 更 准 . 

















角 的 











预测 。 一般 来 说 , 与 相关 性 相 比 , 原因 能 够 为 我 们 提供 更 为 可 靠 的 方法 来 





预测 事件 的 结果 。 























再 举 一 个 例子 ， 比 如 说 某 种 基因 的 变异 导致 了 运动 耐量 的 提高 和 免 


疫 反应 的 增强 。 然 后 我 们 可 能 会 发 现 , 运动 耐量 的 提高 对 人 体 免疫 反应 来 
说 是 个 好 指标 。 然 而 , 运动 耐量 的 高 低 变 化 只 是 一 个 非常 粗略 的 估计 ， 因 
为 除了 基因 突变 以 外 , 还 有 很 多 其 他 因素 ( 比如 充血 性 心力 衰竭 ) 也 会 导 
致 运动 耐量 的 变化 ,因此 ,只 根据 运动 耐量 进行 诊断 可 能 会 导致 很 多 误诊 ， 
错误 地 夸大 或 低估 病人 的 病情 。 更 重要 的 是 , 一 旦 了 解 到 基因 变异 会 引起 
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运动 耐量 和 人 免疫 反应 的 双重 提高 /增强 ,我 们 就 能 获得 两 种 测算 风险 的 方 









































基因 测试 极 易 出 错 的 话 , 那么 运动 耐量 的 测试 数据 也 许 








的 证 据 。 还 有 一 点 , 将 患者 送 到 运动 生理 学 实验 室 去 测试 他 的 运动 耐量 的 
成 本 , 可 能 要 比 单独 测试 某 一 种 基因 变 体 高 得 多 。 然而, 我 们 无 法 将 测试 
方法 的 直接 性 和 它 所 花费 的 成 本 进行 比较 ( 如 果 运 动 耐量 测试 的 成 本 比 
基因 测试 低 得 多 , 那 我 们 可 能 更 倾向 于 先 测试 运动 耐量 , 尽管 这 种 测试 方 
法 是 间接 的 )， 除 非 我 们 知道 这 些 因 素 之 间 潜 在 的 因果 关系 。 因 此 ， 即 便 


























法 , 并 且 能 够 避免 收集 过 多 的 测量 数据 。 既 然 运 动 耐量 只 是 反映 了 基因 的 
变化 , 那么 我 们 就 没有 必要 对 这 两 者 都 进行 测试 。 但 值得 注意 的 是 , 如果 

















能 为 我 们 提供 确 瘦 


























我 们 只 想 预 测 谁 会 赢得 大 选 , 或 者 某 个 病人 患 某 种 疾病 的 风险 有 多 大 , 只 
要 了 解 了 那些 因素 为 什么 具有 预测 作用 , 就 能 够 提高 决策 的 准确 性 并 降低 


























决策 的 成 本 。 


























现在 ， 我 们 想 知道 为 什么 有 些 事件 是 相互 关联 的 。 视 力 模糊 和 体重 

下 降 之 间 有 什么 联系 ”如 果 只 知道 这 两 个 症状 经 常 相伴 出 现 , 是 无 法 得 出 
更 多 信息 的 。 只 有 找到 导致 这 二 者 的 共同 原因 一 一 糖尿 病 一 一 我 们 才能 

解 它们 之 间 的 关联 。 很 明显 , 在 这 类 事件 中 , 我 们 要 找到 事情 发 生 的 原因 ， 








而 这 也 是 我 们 一 直 在 做 却 极 少 深入 研究 的 事 。 























也 许 你 曾 看 过 有 关 “ 食 用 红 肉 的 人 群 死亡 率 更 高 ”的 研究 ， 但 如 果 














你 不 知道 其 中 的 原因 , ABA AEA TAY. th 
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Pran 



































F 吃 红 肉 的 人 喜欢 饮 


酒 或 不 爱 运动 , 这 些 都 是 影响 死亡 率 的 因素 。 而 且 , 即便 死亡 率 的 升 高 真 
是 红 肉 引起 的 , 与 其 他 因素 无 关 , 那 也 要 根据 具体 情况 来 决定 用 何 种 方 
法 来 降低 这 种 风险 。 如 果 死 亡 率 的 升 高 是 不 卫生 的 烧烤 方式 造成 的 , 那 我 
{HAT RPP TIE; 如 果 是 吃 红 肉 本 身 引起 的 , 那 我 们 就 只 能 让 自己 








成 为 素食 主义 者 了 。 我 们 想 知道 的 不 仅 是 红 肉 是 否 与 死亡 率 有 关 , 而 是 红 
肉 是 否 真 的 会 提升 死亡 率 。 我 之 所 以 格外 强调 这 种 说 法 , 是 因为 报纸 的 科 





学 版 块 几乎 每 周 都 会 写 一 些 与 饮食 和 健康 相关 的 内 容 ， 








比如 鸡蛋 能 引发 / 
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预防 各 种 病痛 ， 咖 中 








会 提高 /降低 死亡 的 风险 。 这 类 研究 有 时 可 能 不 仅 会 





提供 某 件 事 与 某 类 人 群 之 间 的 相关 性 ,还 会 提供 一 些 其 他 证 据 , 但 是 , 所 


有 这 类 研究 都 值得 怀疑 , 我 们 要 对 每 一 个 细节 进行 批判 性 的 考证 , 尤其 是 




















要 用 这 些 结论 来 指导 各 种 政策 和 行为 的 时 候 (第 9 章 将 进行 讨论 )。 














有 些 时 候 ， 我 1 


门 要 去 解释 一 些 事件 发 生 的 原因 。 你 上 班 为 什么 迟到 





T? 某 人 为 什么 生病 了 ? 为 什么 一 个 国家 入 侵 了 男 一 个 国家 ? 在 这 些 情 











况 下 ,我 们 想 知 道 是 谁 或 者 是 什么 因素 引发 了 某 个 事件 ,迟到 与 交通 有 关 ; 


随 着 年 龄 的 增长 ,人 们 会 患 各 种 疾病 ; 很 多 战争 都 是 由 于 人 们 在 意识 形 克 
上 存在 分 层 。 但 这 些 并 不 能 告诉 我 们 上 述 事 件 发 生 的 原因 。 你 迟到 可 能 




















4 
态 
是 














因为 汽车 抛锚 了 ,Jane 生病 可 能 是 因为 食物 中 毒 ， 某 场 战争 可 能 是 领土 或 


资源 争端 引起 的 。 





找到 事件 发 生 的 根源 很 重要 ， 它 不 但 会 影响 政策 的 制定 ( 如 果 Jane 
生病 的 原因 是 餐厅 的 卫生 条 件 太 差 了 , 那 她 可 以 不 再 去 那 家 餐厅 吃饭 , 但 
无 须 避 讳 那 天 所 吃 的 食材 ) 与 责任 的 归属 ( 谁 该 为 Jane 的 病情 负责 )， 还 
会 影响 人 们 对 某 件 事 的 反应 ,很 多 疾病 的 症状 可 能 与 服用 治疗 该 疾病 的 药 
物 后 产生 的 症状 相同 。 比 如 说 , 慢性 肾病 会 导致 肾 衰竭 , 但 在 极 少数 案例 






































中 , 治疗 慢性 肾病 的 药物 可 能 会 对 肾 造 成 同样 的 损伤 。 如 果 门 诊 医生 看 到 
患 有 肾病 的 人 同时 也 在 服用 会 导致 凤 损伤 的 药物 , 那 他 就 需要 明确 这 个 病 
























































人 的 肾病 是 否 是 由 服用 的 药物 导致 的 , 这 样 才能 为 病人 制定 正确 的 治疗 方 


























Ro 虽然 知道 了 服用 某 些 治疗 肾病 的 药物 也 可 能 导致 凤 损 伤 , 但 医生 无 法 





仅 根 据 这 一 点 就 确认 某 个 病人 是 否 属于 这 种 情况 。 只 有 在 确认 病人 是 否 属 
































于 这 种 情况 后 ， 才 能 决定 是 否 要 让 病人 停止 服用 这 种 药物 。 




















因果 关系 最 重要 的 用 途 是 可 以 用 来 干预 某 些 事情 的 发 生 。 我 们 不 仅 
想 知 道 某 些 事件 为 什么 会 发 生 , 更 想 利用 这 些 信息 来 预防 或 促成 某 些 结果 





























的 产生 。 你 可 能 想 知道 如 何 通 过 改变 饮食 习惯 来 改善 身体 的 健康 状况 。 需 
要 服用 维生素 吗 ? 要 坚持 吃素 吗 ? 还 是 要 戒 掉 含 碳水 化 合 物 的 食物 ? 如 
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果 这 些 干预 措施 并 不 能 带 来 你 想 要 的 结果 , 那 就 没 必要 做 这 些 费 时 又 费力 
的 改变 。 同 时 ,我们 还 需要 考虑 这 些 干 预 措施 的 成 效 如 何 。 也 许 你 听 说 某 
个 节食 方案 的 减肥 成 功率 是 100%。 在 基于 这 人 句 话 做 出 任何 决策 之 前 ， 你 
应 该 先 了 解 一 下 这 个 节食 方案 究 竞 帮助 人 们 减 掉 了 多 少 体重 , 不 同 的 人 减 
掉 的 体重 差 是 多 少 ， 这 个 节食 方案 的 效果 和 其 他 节食 方案 相 比 有 何 差别 
( 仅 通过 自己 有 意识 地 控制 饮食 也 是 可 以 减肥 的 ), 我 们 既 要 评估 已 经 采取 
的 干预 措施 是 否 有 效 ( 纽约 市 在 发 布 食物 的 卡路里 值 后 , 是 否 改善 了 市 民 
的 健康 状况 )， 也 要 预测 将 来 可 能 会 采取 的 干预 措施 的 效果 ( 如 果 减 少 快 
餐 中 的 钠 含量 ， 会 出 现 什么 情况 )。 

政府 部 门 必 须知 道 他 们 的 政策 会 对 民众 产生 什么 样 的 影响 ， 并 且 必 
须 制定 出 能 满足 民众 需求 的 政策 。 比 如 , 研究 人 员 发 现 含 钠 量 高 的 食物 与 
肥胖 症 有 关联 。 于 是 , 立法 人 员 决 定 颁布 一 项 法 案 , 引 在 减少 餐厅 食物 和 
包装 食品 的 含 钠 量 。 如 果 含 钠 量 和 肥胖 症 之 间 的 唯一 联系 是 , 高 热量 的 快 
餐 食品 导致 了 肥胖 症 ， 而 这 些 食品 又 正好 含 钠 量 高 ， 那 么 这 项 法 案 将 不 
会 产生 任何 作用 。 人 们 依然 会 购买 快餐 ， 而 快餐 才 是 一 开始 就 应 该 关注 
的 问题 。 我 们 必须 保证 我 们 的 干预 措施 针对 的 是 真正 影响 结果 的 原因 。 如 
果 我 们 只 干预 了 一 些 与 结果 相关 的 因素 〈( 比如 通过 禁止 使 用 火柴 来 减少 
死 于 因 吸 烟 导 致 的 肺癌 的 人 数 )， 那 这 样 的 干预 措施 是 不 会 有 效果 的 。 

如 果 干 预 措施 还 有 副作用 的 话 ， 那 么 情况 就 更 加 复杂 了 ， 这 一 点 我 
们 后 面 再 讨论 。 因 此 , 我 们 不 仅 要 知道 造成 某 个 结果 的 原因 ,还 要 知道 这 
个 结果 会 带 来 什么 影响 。 比 如 ,增加 运动 量 会 导致 体重 下 降 , 但 是 “ 补 
偿 效 应 ”又 会 导致 人 们 去 摄 入 更 多 的 热量 ， 甚 至 比 他 们 消耗 掉 的 热量 还 
要 多 ( 于 是 他 们 的 体重 不 降 反 升 )。 所 以 我 们 要 做 的 不 是 去 寻找 个 体 变 量 
之 间 的 单一 联系 , 而 是 要 对 事物 间 各 种 相互 关联 的 关系 有 一 个 更 为 宏观 的 


认识 fe) 
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1.4 接 下 来 ……… 


人 们 为 什么 会 在 不 相关 的 事件 之 间 看 到 关联 性 ”陪审 团 如 何 评估 犯 
罪 的 原因 ? 我 们 如 何 通过 实验 来 得 知 某 个 病人 应 该 服用 哪 种 药物 ? 随 着 
我 们 对 数据 和 算法 的 依赖 程度 越 来 越 高 , 了 解 因果 关系 已 经 成 为 一 项 必须 
掌握 的 技能 。 我 们 不 仅 需 要 利用 这 一 技能 从 数据 中 提取 有 用 的 信息 , 还 要 
用 它 来 指导 日 常生 活 中 的 各 种 决策 ,即使 你 的 工作 并 不 包括 做 研究 或 分 析 
数据 ， 因 果 推 理 的 各 种 潜在 用 途 也 会 对 你 产生 影响 ， 比 如 你 要 与 别人 分 
享 什么 样 的 个 人 信息 ， 以 及 与 哪些 人 分 享 。 

为 了 更 加 准确 地 寻找 和 使 用 原因 ， 我 们 需要 知道 因果 推理 过 程 中 的 
心理 活动 (我 们 是 如 何 感知 并 推理 事件 发 生 的 原因 的 )， 还 要 知道 如 何 评 
估 我 们 手中 的 数据 (不管 是 通过 观察 还 是 实验 获得 的 )， 以 及 如 何 利用 这 
些 知 识 进 行 决策 。 尤其 是 要 考察 所 收集 的 数据 ( 以 及 我 们 操控 这 些 数据 的 方 
式 ) 是 如 何 影响 我 们 从 中 得 出 的 结论 的 。 在 本 书 中 , 我们 将 探索 如 何 利 用 各 
种 论据 来 支持 或 反对 某 种 因果 关系 (既是 正方 也 是 反方 )、 如 何 利用 因果 关 
系 中 的 信号 来 超越 那些 间接 的 证 据 ， 以 及 如 何 准确 地 找到 并 理解 这 些 信号 。 






























































































































































注释 


1， 想 要 了 解 Meadow 所 用 的 数据 ， 参 见 Fleming 等 ( 2000 )。 想 要 了 解 Meadow 
对 使 用 这 一 数据 的 评论 ， 参 见 Meadow (2002 )。 

2. Meadow 因为 在 证 词 中 使 用 了 这 一 数据 ， 后 来 被 判 渎职 罪 ， 并 被 吊销 了 医 
生 执 业 资 格 ， 导 致 他 不 能 再 行医 ( 后 来 他 通过 上 诉 得 以 恢复 执业 资格 )。 

3. 参见 Thompson 和 Schumann ( 1987 )。 还 有 一 个 著名 的 案例 是 Lucia de Berk 
案 。Lucia de Berk 是 荷兰 的 一 名 护士 。 像 Clark 一 样 ， 她 一 开始 也 被 误 判 为 
有 罪 ， 后 来 又 被 宣布 为 无 罪 。De Berk 护理 过 很 多 意外 死亡 的 病人 ， 一 名 专 
家 证 人 计算 了 这 一 情况 发 生 的 概率 ， 得 出 的 结果 是 这 一 情况 完全 是 巧合 的 
概率 只 有 三 亿 四 千 二 百 万 分 之 一 。 了 解 更 多 关于 Lucia de Berk 案 的 信息 ， 
请 参见 Buchanan (2007 )。 正 如 Clark 案 一 样 ， 这 个 数据 被 等 价 为 De Berk 
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22. 
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24. 
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无 罪 的 概率 。 检 方 认为 这 一 概率 发 生 的 可 能 性 如 此 之 小 ， 所 以 它 一 定 不 可 


.值得 注意 的 是 ，SIDS 只 是 导致 婴儿 狂 死 的 原因 之 一 。 事 实 上 ,在 Clark 一 











案 中 ， 有 重要 证 据 表 明 其 中 有 一 个 婴儿 患 有 炎症 ， 并 且 这 一 炎症 可 能 会 对 
婴儿 造成 生命 危险 。 然 而 ， 参 与 该 案 的 病理 学 家 ( 该 病理 学 家 后 来 被 判 严 
渎职 罪 ， 并 被 禁止 行医 三 年 ) 在 庭审 中 并 未 公布 这 一 证 据 。 
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.具体 案例 参见 Lagnado 和 Speekenbrink (2010 )。 











注意 : 休 诬 一 定 不 会 狗 成 这 样 的 评价 。 他 认为 如 果 原 因 和 结果 之 间 存 在 时 
间或 空间 上 的 间隔 ， 那 人 们 就 会 发 现 一 系列 将 原因 和 结果 连接 在 一 起 的 中 
间 原 因 。 
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Nichols (2008 )。 

当 判 断 因果 关系 的 过 程 中 存在 多 种 文化 差异 时 ， 情 况 更 是 如 此 。 比 如 说 ， 
有 些 人 可 能 会 将 技能 看 成 是 一 种 天 生 的 能 力 ， 人 们 要 么 有 这 样 的 技能 ， 
么 没有 ， 而 其 他 人 可 能 会 认为 根据 环境 和 人 们 的 努力 程度 ， 一 个 人 的 技能 
是 可 以 改变 的 。 

Appelbaum (2011 )。 

有 一 幅 很 棒 的 漫画 向 我 们 阐释 了 各 种 主观 的 规律 ， 名 叫 “Electoral Precedent” ~ 
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人 们 是 如 何 寻找 原因 的 ? 


1692 年 ,马萨诸塞 州 塞 勒 姆 镇 上 有 两 个 小 姑娘 突然 行为 失常 。Abpigail 
Williams ( 11 4 ) 和 Elizabeth Parris (9 岁 ) 突然 出 现 了 痉挛 和 抽 搞 的 症状 。 
由 于 她 们 没有 任何 明显 的 生理 疾病 , 于 是 医生 认为 她 们 的 古怪 行为 可 能 是 
MARE BUN BRA, SAIL DRT ERIE. Beet, ATUL 
人 因此 被 指控 为 女巫 。 

人 们 一 直 认 为 塞 勒 姆 镇 的 女巫 审判 案 是 一 场 大 规模 的 净 症 和 骗局 ， 
但 在 近 三 百年 之 后 却 提出 了 一 个 新 的 假设 : 麦角 中 毒 。 食用 麦角 菌 ( 生 
长 在 黑 麦 和 其 他 谷物 上 的 一 种 菌 类 ) 会 导致 麦角 中 毒 ZEMA 
W REER, 甚至 会 影响 精神 的 疾病 。 这 一 假设 利用 当时 的 天 气 记录 来 
说 明 当 时 的 环境 很 适宜 麦角 菌 的 生长 , 而 且 女巫 案 发 生 的 时 间 也 正 是 收获 
与 食用 黑 麦 的 季节 。 不 过 , 这 似乎 暗示 了 还 有 很 多 人 应 该 也 吃 了 黑 麦 , 却 
没有 出 现 麦角 中 毒 的 症状 ( 这 就 降低 了 这 个 假设 的 可 信和 度 )， 但 因为 孩子 
们 可 能 更 容易 受到 麦角 中 毒 的 影响 ， 所 以 可 能 只 有 他 们 出 现 了 中 毒 的 症 
状 。 此 外 ,还 有 一 位 历史 学 家 发 现 发 生 女 巫 案 的 区 域 、 黑 麦 的 价格 及 收获 
季节 这 几 个 因素 之 间 存 在 相关 性 。” 
角 中 毒 似 乎 是 一 个 非常 合理 的 解释 ， 但 有 些 证 据 却 是 相互 矛盾 的 。 

RUE , 但 塞 勒 姆 镇 没有 关于 
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暴发 坏 痊 症 的 记录 。 而 且 , 这 种 抽 搞 症 很 可 能 会 影响 所 有 家 庭 成 员 ， 人 们 
也 曾 认为 这 是 一 种 传染 病 。” 越 小 的 孩子 越 容易 感染 这 种 疾病 ， 但 在 塞 勒 
姆 女巫 案 中 , 出 现 这 种 症状 的 绝 大 部 分 都 是 十 岁 以 上 的 孩子 。 然而 最 离奇 
的 是 , 这 些 症状 似乎 会 因为 “女巫 ”的 出 现 而 受到 影响 ,因为 这 些 女 孩 一 
离开 法 庭 ， 身上 的 症状 就 会 减轻 。 如 果 这 些 症状 是 由 麦角 中 毒 引起 的 , 那 
么 似乎 就 不 应 该 因为 在 场 人 员 的 变化 而 发 生 如 此 戏剧 性 的 改变 。 

尽管 麦角 中 毒 的 解释 遭 到 了 反驳 “， 但 一 直到 1982 年 ,《 纽 约 时报 》 
都 还 在 发 表 有 关 麦 角 中 毒 的 文章 。’ 不 论 何 时 何 地 ， 人 们 都 愿意 去 相信 那 
些 符合 他 们 当下 认 知 的 因果 解释 , 即使 这 些 解释 与 所 得 数据 并 不 吻合 。 在 
17 世纪 ， 人 们 认为 巫 术 是 很 合理 的 解释 ， 并 会 重点 强调 支持 这 一 解释 的 
事实 ,尽管 这 些 事实 是 高 有 高 度 偏见 的 、 不 科学 的 试验 ， 如 “项 灵 证 据 ” 
(原告 看 到 被 告 伤害 他 们 的 幻象 ) 等 。 在 20 世纪 ， 像 “中 毒 ” 这 样 的 科学 
解释 更 加 容易 理解 , 但 还 是 无 法 解释 为 何 这 些 症 状 只 出 现在 一 群 十 几 岁 的 
孩子 身上 。 

























































































17 世纪 初 ， 人 们 之 所 以 会 认为 巫 术 是 一 种 合理 的 解释 ， 是 因为 他 们 
对 原因 的 认 知 是 由 他 们 对 现实 的 感知 、 基 于 经 验 的 推理 以 及 已 有 的 知识 组 
成 的 。 物 理学 告诉 我 们 : 如 果 你 击 打 一 个 球 , 它 就 会 开始 深 动 。 但 如 果 你 
之 前 了 解 到 的 知识 是 地 球 是 一 个 平面 , 或 者 巫 术 能 把 物体 从 房间 的 这 头 移 
动 到 那 关 ,那么 你 可 能 就 会 对 台球 的 运动 原理 做 出 不 同 的 预测 和 解释 。 

知道 在 哪里 更 容易 找到 原因 、 哪 里 更 容易 出 错 既 有 助 于 我 们 设计 出 
更 好 的 数据 分 析 软 件 , 也 能 对 日 常生 活 有 所 帮助 。 本 章 将 探讨 我 们 对 因果 
关系 的 认 知 是 如 何 随 着 时 间 的 变化 而 发 生变 化 的 , 以 及 我 们 是 如 何 通过 对 
世界 的 观察 和 与 世界 的 互动 来 把 握 事件 发 生 的 原因 的 。 当 我 们 想 要 评判 一 
个 人 的 行为 时 ,比如 责怪 某 人 害 我 们 上 班 迟 到 了 ，, 或 者 表扬 某 人 谨慎 的 开 
































车 态度 , 我们 的 推理 
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就 不 仅 基于 因果 关系 了 。 明 确 哪些 其 他 因素 ( 比如 期 





待 ) 会 影响 我 们 对 责任 的 判断 ， 有 助 于 我 们 更 好 地 理解 这 一 行为 。 然 而 ， 





人 们 对 于 事 从 


发 生 的 原因 比 妇 








们 从 一 个 人 群 














1 赢得 一 场 比赛 ) 可 能 会 有 不 同 的 看 法 。 我 

















! 学 到 的 判断 因果 关系 的 知识 也 许 并 不 适用 于 男 一 个 人 群 。 





所 以 , 我 们 将 会 研究 影响 因果 关系 判断 的 社会 因素 和 文化 因素 。 最后, 还 
会 讨论 为 什么 我 们 如 此 容易 受到 因果 雇 论 的 影响 , 以 及 为 什么 我 们 明知 会 




















被 错误 的 因果 关系 观念 ( 比如 迷信 ) 影响 ,但 它们 还 依然 存在 。 





2.1 原因 的 寻找 与 使 用 











你 是 怎么 发 现 按 一 下 开关 灯 就 会 亮 的 ? 你 是 怎么 知道 是 先 开 枪 然后 发 




















出 的 声音 ， 而 不 是 先 有 声音 后 必 











F 枪 的 ?因果 关系 的 学 习 主 要 包括 两 点 : 感 




















知 ( 对 因果 关系 的 直接 体验 ) 和 推理 ( 从 不 含 因 果 关 系 的 信息 中 进行 推断 )。 
当 我 们 在 感知 因果 关系 时 ， 并 不 是 要 通过 模式 识别 的 方式 将 我 们 所 

















观察 到 的 内 容 与 先前 的 知识 相 联系 , 而 是 要 去 亲身 体验 这 种 关系 。 当 看 到 


一 块 砖头 飞 进 窗 








户 、 一 个 台球 被 另 一 个 台球 撞击 后 开始 滚动 , 或 者 一 根 火 





内 点 燃 了 蜡烛 ,你 就 会 根据 这 些 感官 输入 而 感觉 到 事件 间 的 因果 关系 。 相 
反 , 像 食物 中 毒 、 战 争 和 身体 健康 等 现象 就 无 法 通过 观察 而 直接 感知 到 它 
们 发 生 的 原因 ， 必 须 通 过 其 他 方法 来 进行 推理 。 

“我 们 能 够 感知 到 因果 关系 ”这 一 观念 在 哲学 领域 是 有 争议 的 ， 而 且 
与 休 议 的 理论 正好 相反 ， 休 谎 认 为 我 们 只 能 通过 观察 来 了 解 事物 间 的 因果 
关系 。 本章 将 会 展示 一 些 强 有 力 的 实验 证 据 , 以 此 来 证 明 我 们 是 能 够 感知 
到 事件 间 的 因果 关系 的 。 感知 理论 认为 ,， 人 的 大 脑 中 存在 某 种 程序 ， 可 以 
接收 外 界 输入 的 信息 并 将 这 些 信息 分 成 有 因果 关系 的 和 没有 因果 关系 的 ， 
而 不 是 通过 其 他 线索 来 寻找 事件 发 生 的 原因 。 尽 管 心理 学 研究 已 经 证 明 




















大 脑 具 有 感知 因果 关系 的 能 力 , 但 仍然 存在 一 个 问题 : 推理 和 感知 是 否 是 
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大 脑 中 可 分 离 的 两 种 活动 ? 为 了 验证 这 一 问题 , 人 们 利用 一 些 案例 来 进行 
实验 , 这 些 案例 中 的 感知 和 判断 是 相互 矛盾 的 , 因为 如 果 感 知 和 判断 是 同 
一 种 活动 , 那么 两 种 情况 下 的 答案 应 该 是 一 样 的 。 研 究 结果 证 明 ， 人 们 在 
相互 矛盾 的 感知 和 判断 案例 中 给 出 的 答案 确实 是 不 同 的 。 但 因为 这 些 答 案 
是 人 们 对 自己 直觉 的 描述 , 所 以 我 们 是 不 可 能 完全 将 感知 从 推理 中 分 离 出 
来 的 。 

要 想 设 计 出 能 够 将 这 两 种 活动 分 开 的 实验 ( 要 确保 判断 活动 没有 感 
知 的 参与 ,感知 活动 也 没有 判断 的 参与 ) 并 不 容易 ,但 是 针对 裂 脑 患者 的 
研究 却 为 我 们 提供 了 一 些 线索 ,这 些 患 者 的 大 脑 左右 半球 之 间 的 联系 已 经 
部 分 或 完全 断裂 , 所 以 两 个 脑 半 球 之 间 的 任何 信息 传输 都 有 延迟 。 这 对 感 
知 的 研究 十 分 有 帮助 : 如 果 感 知 和 推理 是 由 不 同 的 脑 半 球 来 处 理 的 , 那么 
这 些 患者 的 大 脑 就 有 可 能 独立 地 呈现 这 两 种 活动 。 研 究 人 员 通 过 每 次 只 在 
某 个 视线 范围 内 展示 刺激 物 ， 从 而 控制 大 脑 的 哪个 半球 能 够 接收 到 信息 。 
在 感知 和 推理 因果 关系 时 , 正常 人 的 大 脑 并 没有 表现 出 任何 差异 , 但 是 裂 
脑 患 者 却 有 显著 的 差别 , 这 是 因为 执行 这 项 任务 的 是 不 同 的 大 脑 半 球 。 这 
似乎 表明 了 推理 和 感知 是 可 以 分 离 的 两 种 活动 , 并 且 这 两 种 活动 所 用 到 的 
大 脑 区 域 可 能 是 不 同 的 。” 






























































































































































2.1.1 感知 


这 些 研 究 表 明 ， 感 知 活动 可 以 独立 于 推理 活动 而 发 生 ， 但 我 们 究 竞 
什么 时 候 才 能 感知 到 事物 间 的 因果 关系 呢 ? Albert Michotte 对 感知 因果 关 
系 的 基础 性 研究 向 我 们 证 实 了 这 一 点 : 当 人 们 看 到 图 像 中 的 一 个 模型 向 另 
一 个 模型 运动 并 且 击 中 了 它 , 然后 第 二 个 模型 开始 运动 , 他 们 就 会 感觉 
二 个 模型 是 由 第 一 个 模型 “发 动 ”的 。* 尽 管 这 只 是 一 些 图 像 而 不 是 实物 ， 
但 是 这 个 结论 却 非常 真实 , 还 有 其 他 研究 者 也 做 了 相同 的 实验 并 得 出 了 同 
样 的 结论 。Michotte 的 研究 为 因果 关系 心理 学 芮 定 了 基础 ， 同 时 ， 他 所 设 
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计 的 在 事件 间 存 在 不 同时 间 延 迟 和 间隔 的 实验 , 也 为 我 们 提供 了 很 多 关于 
时 间 如 何 影 响 感知 的 真知 灼 见 ， 这 些 内 容 我 们 将 在 第 4 章 进 行 讨 论 。 
我 们 对 因果 关系 的 理解 是 如 何 演变 的 ? 这 其 中 又 有 多 少 是 后 天 习 得 
的 ? 解答 这 些 问题 的 关键 之 一 来 自我 们 对 婴儿 的 研究 。 如 果 我 们 能 够 直接 
感知 到 因果 关系 , 那么 婴儿 应 该 也 有 这 种 能 力 。 当 然 , 测试 婴儿 对 因果 关 
系 的 感知 能 力 不 是 一 件 容 易 的 事 ， 因 为 我 们 无 法 询问 这 些 婴 儿 的 感受 。 
有 证 据 表明 婴儿 看 新 事物 的 时 间 要 长 一 些 ， 因 此 研究 人 员 让 这 些 婴 
儿 先 熟悉 某 个 事件 序列 ,然而 再 将 这 一 事件 序列 倒 过 来 给 他 们 看 , 并 比较 
婴儿 看 这 两 种 事件 序列 所 用 的 时 间 。 婴 儿 观 看 的 是 一 些 发 动 序列 的 视频 









































(第 4 章 将 进行 详细 论述 ), 这 和 一 个 台球 击 

















' 男 一 个 原本 静止 的 台球 的 事 





件 序列 相似 。 第 一 个 球 将 动力 传 给 第 二 个 球 , 然后 第 二 个 球 按照 第 一 个 球 
运动 的 方向 开始 运动 ,首先 按照 正常 顺序 播放 这 些 视频 ,然后 倒序 播放 ( 击 











序列 〈 比如 两 个 模型 都 朝 同一 个 方向 运动 ， 
































关系 发 生 的 变化 ( 也 就 是 因果 关系 的 对 调 ) 
有 这 种 变化 , 那么 婴儿 观看 这 两 个 序列 ( 逆 














球 的 过 程 反 过 来 了 ， 就 好 像 第 二 个 球 击 中 了 第 一 个 球 一 样 )。 研究 人 员 还 
给 这 些 婴 儿 以 正 序 和 倒序 播放 了 一 些 与 上 述 序列 类 似 但 不 含 发 动 过 程 的 





但 没有 任何 接触 )。 这 个 实验 





的 主要 发 现 是 , 婴儿 观看 倒序 序列 的 时 间 更 长 。 这 两 种 序列 都 按照 正 序 和 
到 序 进行 了 播放 , 所 以 如 果 婴 儿 在 含有 因果 关系 的 序列 中 没有 感知 到 因果 




















， 而 不 含 因果 关系 序列 中 又 没 
向 播放 的 含 因果 关系 的 序列 和 





逆向 播放 的 不 含 因果 关系 的 序列 ) 的 时 间 就 应 该 没有 差别 。” 














at 





o> 


球 的 随意 碰撞 ) 的 感知 能 力 是 有 差别 的 。 
年 龄 的 增长 而 增强 。6 到 10 个 月 大 的 婴儿 




















尽管 我 们 似乎 在 婴儿 时 期 就 能 够 感知 因果 关系 了 ， 但 还 有 一 些 研 究 
明 ，6 个 月 天 的 婴儿 和 10 个 月 大 的 婴儿 对 更 加 复杂 的 因果 关系 〈 比如 




















“有 研究 表明 ， 感 知 能 力 随 着 





能 够 感知 两 个 物体 之 间 的 简单 


的 因果 关系 , 但 因果 链 实验 (诸如 绿 球 撞 击 红 球 , 红 球 再 撞击 蓝 球 这 样 的 






























































因果 关系 序列 ) 表明 ，15 个 月 大 的 婴儿 和 成 年 人 能 够 感知 到 因果 链 中 的 














26 ， 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 
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果 关 系 ， 

















而 10 个 月 大 的 婴儿 却 不 能 。" 要 对 比 年 龄 较 大 的 孩子 和 成 人 








的 感知 能 力 是 一 项 十 分 具有 挑战 性 的 工作 , 因为 他 们 之 间 的 差异 可 能 是 由 
表达 能 力 造 成 的 。 有 些 研究 简化 了 任务 , 用 一 套 具有 某 种 限制 的 图 像 来 测 
试 3 到 9 岁 儿 童 的 反应 。 结果 发 现 , 连 最 小 的 参与 者 都 具有 高 级 的 因果 关 
系 推理 能 力 ， 不 过 这 种 能 力 在 不 同年 龄 的 儿童 身上 依然 存在 差异 。” 





Ag 
























































F 龄 的 人 在 感知 因果 关系 的 能 力 上 所 表现 出 的 最 大 差异 ， 似 乎 











出 现在 感知 与 推理 相互 矛盾 的 时 候 , 因为 孩子 们 更 依赖 于 对 事件 的 感性 认 
知 ， 而 成 年 人 则 更 依赖 于 对 事件 的 进一步 了 解 。 有 这 样 一 个 实验 ,分 别 把 
两 个 机 械 装置 ( 一 个 快 一 个 慢 ) 藏 在 同一 个 盒子 里 , 每 个 机 械 装 置 都 能 高 
响 铃 销 。 往 盒子 里 放 一 个 球 时 ， 如 果 使 用 的 是 快速 机 械 装置 ,会 立即 敲 响 

































































FOES, UIE EL, ALA AM, BAR 
悉 了 这 两 个 机 械 装 置 并 且 知 道 盒子 里 是 哪 一 个 装置 的 情况 下 ，5 岁 的 儿童 


依然 是 去 感知 而 非 推理 因果 关系 ，9 到 10 岁 的 儿童 及 成 人 能 够 正确 地 推 


















































理 出 因果 关系 ,而 7 岁 的 儿童 则 介 于 两 者 之 间 (判断 的 准确 率 在 50% 左 
右 )。 当 盒子 里 是 慢 速 机 械 装 置 时 ， 先 放 进 一 个 球 ， 过 一 会 儿 会 再 放 进 去 
一 个 球 。 在 第 二 个 球 进入 盒子 之 后 铃 销 立即 响起 ,但 由 于 机 械 装置 的 延迟 ， 
铃 匀 的 响声 与 第 二 个 球 没有 任何 关系 。 尽 管 第 二 个 球 不 可 能 导致 铃 匀 发 出 
声响 ， 但 是 年 龄 小 的 孩子 依然 选择 第 二 个 球 作为 铃 销 响 的 原因 。"™ 

Fl Michotte 以 来 ,许多 研究 感知 的 实验 都 会 直接 询问 参与 者 对 于 某 
个 场景 的 观点 ， 比 如 让 他 们 描述 所 观察 到 的 内 容 。 然 而 , 这 并 不 能 捕捉 到 
感知 过 程 中 的 本 能 反应 。 为 了 了 人 解 这 些 反 应 , 研究 人 员 最 近 在 成 年 参与 者 
身上 使 用 了 眼 动 追踪 技术 。 他 们 不 再 记录 参与 者 的 观察 时 长 , 而 是 关注 他 
们 都 观察 了 哪些 地 方 。 这 一 研究 表明 , 在 发 动 式 的 事件 序列 中 , 参与 者 会 
预测 由 因果 关系 所 导致 的 运动 ， 并 且 相 应 地 转移 自己 的 注意 力 。“ 这 意味 

















着 不 论 参与 者 是 否 承 认 序 列 中 包含 因果 关系 , 他 们 对 事件 发 展 的 期 望都 表 
















































































明 , 他 们 预测 到 一 个 物体 的 移动 是 通过 与 男 一 个 物体 的 接触 而 产生 的 。 在 
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这 之 后 的 另 一 项 研究 不 仅 记 录 了 眼球 的 运动 , 还 记录 了 参与 者 对 因果 关系 
的 判断 ( 这 与 Michotte 的 研究 一 样 )。 这 项 研究 发 现 ， 在 简单 的 事件 序列 
中 ,眼球 运动 和 因果 关系 是 相关 的 , 但 在 加 入 时 间 延 迟 之 后 , 参与 者 的 眼 






































球 运动 和 因果 关系 判断 就 不 再 具有 相关 性 了 。 ” 














在 情景 简单 的 实验 研究 中 ， 产 生 感 知 偏差 的 主要 是 儿童 ， 但 成 年 人 








对 自身 因果 关系 感知 能 力 的 信任 也 可 能 会 导致 他 们 做 出 错误 的 判断 。 如 果 














你 听 到 一 声 巨 响 , 然后 看 到 房间 里 的 灯 灭 了 , 你 就 可 能 认为 这 两 个 事件 是 
有 联系 的 ， 但 其 实 是 有 人 在 发 生 巨 响 的 时 候 正好 关 了 灯 。 事 件 发 生 的 时 
间 以 及 空间 上 的 邻近 性 等 因素 会 导致 人 们 错误 地 感知 因果 关系 , 从 而 做 出 
错误 的 因果 关系 判断 。 我 们 常 听 说 有 人 在 打 了 流感 疫苗 的 当天 就 出 现 了 类 
似 流 感 的 症状 , 于 是 就 有 人 认为 是 流感 疫苗 引起 了 这 些 症 状 。 在 前 面 的 实 























验 中 , 盒子 里 的 慢 速 机 械 装 置 是 无 法 在 第 二 个 球 进入 盒子 时 就 立即 敲 





向 铃 


SHR, 同 理 , 流感 疫苗 里 含 的 是 一 种 不 活路 的 病毒 , 这 种 病毒 是 无 法 引起 
流感 的 。 注射 流感 疫苗 的 人 有 很 多 , 其 中 有 些 人 可 能 偶然 感染 了 类 似 的 疾 




















Wi, 甚至 有 可 能 是 在 候诊 室 里 接触 到 了 流感 病毒 。 可 以 通过 关注 事件 的 背 








景 信息 ， 了 解 所 有 可 能 出 现 的 情况 ， 从 而 避免 错误 的 判断 。 


2.1.2 推理 与 论证 








当 试 图 搞 清楚 你 的 车 为 什么 会 发 出 奇怪 的 噪声 ， 或 者 推断 傍晚 喝 的 
咖啡 导致 你 晚上 睡 不 着 觉 时 , 你 无 法 直接 感知 到 汽车 热度 和 刹车 发 出 的 噪 
声 之 间 的 关系 , 也 无 法 直接 感知 到 咖啡 中 的 兴奋 因子 是 如 何 影响 神经 系统 
的 。 相反 , 你 需要 用 到 另外 两 种 类 型 的 信息 : 关于 刹车 系统 工作 原理 的 机 
械 知识 ,以 及 食用 含 兴奋 因子 的 食物 后 该 如 何人 入睡。 所 以 ,即便 我 们 完全 
不 了 解 某 个 原因 的 作用 原理 ， 也 可 以 通过 观察 原因 和 结果 共同 出 现 的 频率 
来 获取 一 些 认 知 。 即 使 我 们 观察 到 的 因果 关系 案例 只 有 一 个 , 也 可 以 根据 
我 们 对 系统 本 身 的 理解 来 进行 推理 。 因 此 , 我们 可 以 通过 对 以 下 两 个 问题 
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别 拿 相关 当 




















果 关 系 简 易 入 门 


的 理解 来 推断 汽车 发 出 噪声 的 原因 : 汽车 的 各 个 部 件 是 如 何 相 互 作用 的 ， 


以 及 系统 中 的 哪些 故障 会 导致 这 种 噪声 。 有 两 种 推理 方法 是 互补 的 : 一 种 
是 利用 协同 变化 法 (事件 共同 发 4 
个 原因 是 如 何 引 起 某 种 结果 的 )。 尽管 研究 人 员 通 
开 研 究 ， 但 我 们 可 以 同时 使 用 它们 来 推理 事件 发 生 的 原因 。“ 这 种 使 
进行 因果 推理 的 方法 有 很 多 , 但 








接 信 息 来 寻找 原 








的 频率 )， 男 一 种 是 运 











j 机 械 知识 〈 某 
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的 过 程 叫 作 因 果 推 理 。 

















重点 是 我 们 并 不 能 直接 感受 到 因 环 





心理 
让 他 们 说 出 是 
视觉 效果 )。 其 
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RRA, 








MES: 给 参与 者 








EI Ave 




















中 到 间 














上 ) 是 某 























将 这 两 种 推理 方法 分 


而 是 要 通过 数据 和 
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ab, 
HAS 


知识 来 推 


展示 一 系列 事件 ， 然 后 
什么 原因 导致 了 某 种 结果 ( 比如 某 种 声音 或 者 屏幕 上 的 某 种 
单 的 任务 是 ， 让 参与 者 判断 是 否 ( 或 者 在 多 大 程度 
个 事件 导致 了 另 一 个 事件 ,比如 证 参与 者 通过 一 系列 观察 来 判 





断 是 否 是 某 一 个 开关 点 亮 了 某 一 划 灯 。 研究 人 员 试 图 通过 改变 不 同 的 变量 





( 比 妇 


系 的 强度 ,等 等 ) 来 破译 影 








ie] MATTE BED 
































H 原 因 和 结果 之 间 的 时 间 延 迟 、 参 与 者 是 否 与 系统 进行 互动 、 因 果 关 





关系 的 因素 。 我 们 已 经 知道 了 





时 空 上 的 距离 会 让 人 们 觉得 某 个 事物 不 大 可 能 是 引发 某 起 事件 的 原因 ,但 
实际 情况 并 非 这 么 简单 。 在 考察 时 间 如 何 影响 我 们 对 因果 关系 的 理解 时 ， 


我 们 发 现 人 的 预期 也 会 对 因 虽 
行 探 讨 。 这 也 是 儿童 和 成 人 在 因果 关系 判断 过 程 
































关系 的 判断 产生 影 























向 , 这 一 点 将 在 第 4 章 进 























存在 的 另 一 个 差异 , 因 


为 他 们 对 事件 发 生 的 可 能 性 有 着 不 同 的 预期 。 比 如 5 岁 的 儿童 在 实验 中 会 


相信 一 个 实际 上 不 可 能 发 生 的 事件 是 


























则 会 意识 到 这 不 过 是 魔术 而 已 。” 

















AIF 
































推理 
一 些 事件 同时 发 生 ， 就 会 假设 它们 之 间 存 在 因 细 
假设 时 依据 的 案例 数量 比 计算 程序 依据 的 数量 少 得 多 。 但 随 着 手 


的 关联 法 本 质 上 前 





























] 魔 法 引起 的 , 但 9 岁 的 儿童 和 成 人 


是 休 资 提出 的 观点 : 如 果 人 们 经 常 看 到 
RRR. “人 类 在 做 出 这 一 








的 数据 








越 来 越 多 , 我 们 也 会 修正 自己 的 观念 , 不 过 有 时 也 会 因为 推理 结论 时 太仓 
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促 而 找到 错误 的 规律 。 当 你 穿 了 一 双 新 球鞋 并 接连 踢 进 了 两 个 球 时 , 你 可 
能 会 觉得 是 新 球鞋 让 你 表现 得 如 此 出 色 , 但 在 之 后 的 十 场 球 中 你 却 一 球 未 
进 ， 这 时 你 可 能 就 会 重新 思考 之 前 在 新 鞋 与 足球 水 平 之 间 建 立 的 联系 。” 

和 感知 能 力 一 样 ， 我 们 在 很 小 的 时 候 就 已 经 具备 从 观察 中 推理 原因 
的 能 力 了 。 有 一 个 实验 专门 测试 了 有 具备 这 种 能 力 的 最 小 年 龄 。 有 一 个 会 播 
放 音 乐 的 盒子 , 如 果 将 某 个 特定 的 木 块 放 在 盒子 顶部 ,这 个 盒子 就 会 播放 
音乐 , 但 如 果 将 其 他 木 块 放 在 盒子 顶部 则 不 会 播放 音乐 。 然 后 孩子 们 会 看 
到 每 一 个 木 块 分 别 放 在 这 个 盒子 上 的 结果 , 以 及 这 些 木 块 都 放 在 盒子 上 的 
结果 。 实验 发 现 , 连 两 岁 的 孩子 都 能 使 用 观察 到 的 信息 来 判断 出 哪 一 个 木 
块 能 够 让 盒子 播放 音乐 。 人 们 随后 对 19 到 24 个 月 大 的 孩子 ”也 进行 了 这 
一 实验 并 得 到 了 同样 的 结果 。 然 后 ， 又 使 用 更 简单 的 结构 对 16 个 月 大 的 
孩子 进行 了 实验 , 实验 结果 表明 , 这 些 孩子 普遍 具有 从 变化 的 模式 中 推理 
原因 的 能 力 。” 

但 是 ， 如 果 关 联 法 是 我 们 寻找 原因 的 唯一 方法 ， 那 我 们 要 怎样 区 分 
事件 中 共同 的 原因 (ILE 2-1a ) 和 共同 的 结果 ( 见 图 2-1b ) 呢 ? 比如 人 们 
会 因为 失眠 而 去 看 电视 、 吃 零食 ， 而 看 电视 、 吃 零食 又 会 导致 失眠 。 在 现 
实生 活 中 ， 即 使 我 们 所 观察 到 的 联系 是 一 样 的 , 我们 也 能 够 区 分 出 不 同 的 
因果 结构 。 如 果 我 既 喝 咖啡 又 吃 饼干 ， 然 后 我 发 现 大 部 分 时 候 自 己 都 精力 
充沛 ， 而 如 果 我 只 喝 咖 啡 ， 大 部 分 时 候 也 会 觉得 自己 精力 充沛 ,那么 我 就 
可 以 推断 出 饼干 并 不 影响 我 的 精力 是 否 充 沛 。 
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FN 看 电视 吃 零食 
看 电视 吃 零食 RIR 
(a) 共同 的 原因 (b) 共同 的 结果 


因果 结构 发 生 了 改变 , 但 失眠 都 与 另 





图 2-1 在 这 两 个 例子 中 , 尽 
外 两 个 活动 相关 联 


me 




















30 ， 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 

















这 种 推理 方法 被 称 为 反 向 阻 断 法 ， 也 是 研究 人 员 在 一 项 研究 中 证 明 
过 的 方法 ， 这 项 研究 的 参与 者 是 3 到 4 岁 的 儿童 。” 这 种 推理 方法 的 思路 
是 , 如 果 在 两 个 因素 都 存在 的 情况 下 出 现 了 某 种 结果 , 在 只 有 第 一 个 因素 
存在 的 情况 下 也 出 现 了 同样 的 结果 , 那么 在 没有 见 到 阻 断 第 二 个 因素 所 带 
来 的 影响 的 情况 下 , 我 们 可 以 推理 出 第 二 个 因素 可 能 不 是 导致 这 种 结果 的 
原因 。 

我 们 再 次 使 用 了 会 播放 音乐 的 盒子 ， 在 盒子 顶部 放 上 特定 的 木 块 ， 
它 就 会 播放 音乐 。 孩 子 们 首先 看 到 木 块 A 和 木 块 B 一 起 放 在 盒子 上 时 ， 
盒子 播放 了 音乐 ， 然 后 又 看 到 盒子 上 只 有 木 块 A 时 也 播放 了 音乐 ( 见 
2-2a )， 这 时 孩子 们 就 认为 木 块 B 不 大 可 能 是 盒子 播放 音乐 的 原因 。 这 
实验 和 前 儿 个 实验 相 比 最 主要 的 差别 在 于 , 在 前 儿 个 实验 中 , 孩子 们 看 
1 了 每 一 个 木 块 单独 放 在 盒子 上 的 结果 , 也 看 到 了 这 些 木 块 共同 放 在 盒子 
上 的 结果 。 而 在 这 个 实验 中 , 木 块 B 并 没有 单独 放 在 盒子 上 , 它 只 和 木 块 
A 一 起 放 在 盒子 上 过 ,这 就 能 让 参与 者 根据 木 块 A 的 效果 间接 判断 出 木 块 
B 的 效果 。 但 在 这 个 实验 中 ，3 岁 儿 童 和 4 岁 儿童 之 间 还 是 有 差别 的 。4 
岁 儿 童 认为 “ 木 块 B 也 能 让 盒子 播放 音乐 ”的 可 能 性 要 更 小 。 
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(a) 反 向 阻 断 法 


















































(b) 间接 推理 法 
图 2-2 ”参与 者 可 以 看 到 前 两 个 实验 的 结果 。 在 第 三 个 实验 中 , 他 们 
必须 预测 如 果 将 这 个 木 块 放 在 盒子 上 ， 盒 子 是 否 会 播放 音 
乐 。 实 心 图 表示 木 块 A， 点 状 图 表示 木 块 B 
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在 这 个 问题 上 , 4 岁 儿 童 的 推理 结果 与 成 年 人 在 研究 中 推理 出 的 结 

















是 一 样 的 。” 有 趣 的 是 ， 孩 子 们 在 推理 因果 关系 时 使 用 的 也 是 间接 证 据 。 
研究 人 员 发 现 ， 即 使 孩子 们 看 到 两 个 木 块 都 在 盒子 上 时 盒子 播放 了 音乐 ， 
然后 又 看 到 盒子 上 放置 其 中 一 个 木 块 后 没有 播放 音乐 ( 见 图 2-2b )， 他 们 
还 是 会 推断 那个 没有 单独 放 在 盒子 上 的 木 块 能 够 让 盒子 播放 音乐 。” 

上 述 推理 方法 与 关联 法 并 不 完全 一 致 ， 因 为 我 们 可 以 从 同一 种 关联 
关系 中 推理 出 多 个 结果 。 还 有 一 种 方法 是 因果 模型 法 ， 它 将 因果 推理 和 




































































一 个 名 叫 “ 贝 叶 斯 网 络 ”的 计算 模型 ( 将 在 第 6 章 进 行 讨 论 ) 联系 在 了 一 


起 。” 这 种 方法 的 理念 是 ， 可 以 把 原因 作为 模型 ( 这 个 模型 可 以 向 我 们 展 
示 有 多 少 件 事物 是 相互 联系 的 ) 的 一 部 分 , 而 不 仅仅 通过 因素 间 的 相关 性 
系 的 强 





或 者 各 个 因素 间 联 












































度 来 寻找 事件 发 生 的 原因 。 图 2-lb 中 的 结构 就 








是 一 个 简单 的 例子 。 我 们 还 可 以 扩展 这 个 结构 , 增加 导致 失眠 的 原因 ( 比 








如 咖啡 因 和 压力 ) 和 深夜 吃 零食 的 影响 〈 比如 发 胖 或 长 性 牙 )。 这 些 结构 
可 以 帮助 我 们 想 出 更 好 的 干预 措施 , 并 帮助 我 们 更 好 地 利用 这 些 干预 措施 











来 了 解 各 个 变量 间 





的 联系 












































o 


还 有 一 种 推理 原因 的 方法 是 建立 在 作用 机 制 上 的 。 简 单 来 说 ， 就 是 
原因 是 促成 结果 的 一 种 途径 , 原因 和 结果 是 通过 一 系列 能 够 导致 结果 发 生 











的 步骤 连接 在 一 起 








的 。 因 此 ,如 果 跑 步 会 让 人 心情 变 好 , 那么 就 一 定 存在 


一 个 跑步 可 以 改变 心情 的 过 程 ,， 比如 跑步 能 够 释放 体内 的 内 啡 肽 。 我们 也 


许 看 不 到 这 个 过 程 

















的 每 


个 组 成 部 分 , 但 整个 过 程 存在 一 个 事件 链 , 将 








原因 和 结果 连接 在 了 一 起 ， 原 因 通 过 这 个 事件 链 促成 了 结果 的 发 生 。” 
然而 ， 因 果 关 系 研究 与 协 变 关 系 研究 所 用 的 方法 是 不 同 的 。 在 因果 


关系 研究 中 , 参与 者 需要 向 实验 者 提 一 些 问题 , 以 便 能 够 解释 某 个 事件 是 

















如 何 发 生 的 。” 在 心理 学 文献 中 , 这 被 称 为 因果 推理 。 与 之 前 的 实验 不 同 ， 
接 下 来 的 实验 任务 要 搞 清 楚 的 是 “ 某 个 足球 运动 员 为 什么 踢 进 了 那 一 球 ” 
这 种 问题 ， 而 不 是 “一 般 情 况 下 足球 和 运动员 进 球 靠 的 是 什么 ” 。 以 交通 事 
































32 ， 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 
































故 为 例 , 研究 人 员 发 现 参 与 者 的 问题 主要 围绕 有 可 能 在 事故 中 起 作用 的 机 
制 〈 比 如 玻 驶 员 有 身体 缺陷 吗 )， 而 不 是 倾向 性 问题 ( 比如 那 条 路 上 发 生 
的 交通 事故 多 吗 )。” 在 这 种 实验 中 ,参与 者 必须 去 询问 他 们 想 要 的 信息 。 
但 在 男 一 种 实验 中 , 我 们 为 参与 者 提供 了 机 制 信息 和 协 变 信息 , 但 参与 者 
在 确定 原因 的 过 程 中 利用 机 制 信息 的 比重 更 大 。 

此 外 ， 我 们 还 把 观察 到 的 信息 和 已 知 的 信息 进行 了 融合 ， 并 且 和 掌握 
了 一 些 与 相关 性 和 作用 机 制 有 关 的 知识 。 因此, 我 们 不 会 仅 依赖 某 一 种 类 
型 的 证 据 来 进行 研究 。 事实 上 , 我 们 还 做 了 很 多 其 他 研究 工作 来 考察 各 种 
信息 是 如 何 ( 而 非 是 否 ) 结合 在 一 起 的 。 比 如 说 ， 有 一 些 实验 表明 ,参与 
者 对 “原因 和 结果 之 间 是 否 存 在 关联 机 制 ” 的 态度 会 影响 他 们 对 事件 之 间 
关联 性 的 看 法 , 但 如 果 两 个 事件 的 关联 性 很 弱 , 那么 参与 者 将 不 会 受到 影 
响 。” 实 际 上 , 参与 者 在 对 观察 序列 ( 比如 某 些 常见 的 /不 常见 的 症状 ) 进 
行 评 估 时 , 可 能 会 把 事件 之 间 已 知 的 关联 以 及 存在 某 种 关联 的 可 能 性 也 考 
虑 进去 。” 

然而 ， 人 们 在 如 何 得 出 各 种 关联 关系 〈 后 面 将 其 统称 为 模型 或 因果 
结构 ) 的 问题 上 却 产 生 了 分 歧 。 有 一 种 观点 是 ,我 们 应 该 先 收集 数据 ， 然 
后 根据 这 些 数据 来 选择 最 可 能 出 现 的 结构 , 或 者 与 我 们 的 观察 结果 最 一 臻 
的 结构 。 如 果 我 们 知道 狗 听 到 大 的 声响 就 会 叫 , 也 知道 摔 门 会 发 出 大 的 声 
响 ， 那 我 们 就 能 缩小 范围 ,缩减 这 些 事件 相关 联 的 可 能 性 方式 , 并 且 排 除 
掉 “ 狗 引起 了 声响 ”这 样 的 模型 。 ”还 有 一 种 观点 认为 ， 很 多 时 候 我 们 都 
是 依靠 各 种 假设 来 思考 问题 的 , 所 以 我 们 应 该 先 提出 一 个 有 可 能 出 现 的 结 
构 ， 然 后 再 根据 了 解 到 的 新 信息 不 断 改变 这 个 结构 。” 

这 些 实验 大 多 很 简单 ， 我 们 能 够 通过 可 控 的 实验 环境 来 分 离 不 同 变 
量 对 结果 的 影响 。 但 在 现实 中 , 我 们 很 少 专门 研究 一 个 (已 经 被 确认 为 潜 
在 原因 的 ) 事物 对 男 一 个 (已 经 被 确认 为 潜在 结果 的 ) 事物 的 影响 程度 。 
比如 某 个 人 突然 开始 头疼 ， 这 时 候 他 就 必须 回想 各 种 可 能 引起 头疼 的 因 
















































































































































































素 。 同样 ,要 想 找 出 某 种 药物 的 过 敏 反 应 , 就 要 从 众多 服 
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用 该 药物 的 人 中 











找到 他 们 服药 后 不 断 出 现 的 共同 症状 。 因果 推 理 活动 通常 包含 两 部 分 : 寻 
找 结构 和 寻找 影响 力 。 结 构 会 告诉 我 们 什么 原因 导致 了 什么 结果 ,而 影响 


力 会 告诉 我 们 这 个 原因 在 多 大 程度 上 导致 了 这 个 结 明 












































(比如 某 种 药物 产生 


某 个 副作用 的 频率 是 什么 ; 或 者 在 收益 报告 发 布 之 后 , 某 个 股票 的 价格 会 
上 涨 多 少 )。 寻找 结构 与 影响 力 的 过 程 是 无 法 完全 分 离 的， 因为 影响 大 的 


原因 比 影响 小 的 原因 更 容易 找到 。 很 多 心理 学 实验 都 会 








点 研究 参与 者 对 


影响 力 的 评估 ， 这 可 能 也 是 人 们 关注 协 变 关系 而 不 是 因果 机 制 的 原因 。 


比如 说 ， 你 注意 到 自己 在 跑步 时 经 常 打 喷 呈 。 














如 果 无 法 改变 跑步 的 


环境 ( 比如 室内 或 室外 、 春 天 或 冬天 ， 等 等 )， 你 就 无 法 发 现 你 打 喷 呈 的 
原因 其 实 是 季节 性 过 敏 ， 而 不 是 对 运动 的 反应 。 在 那些 简单 的 案例 中 ， 

















孩子 们 能 够 仅 通过 观察 一 系列 事件 就 推理 出 正确 的 因 细 
































结构 。 但 如 果 仅 依 














赖 对 数据 的 观察 ,就 会 让 人 们 混淆 因果 关系 ,比如 仅 因 为 两 个 结果 有 一 个 
共同 的 原因 并 且 经 常 同 时 出 现 , 就 错误 地 以 为 这 两 个 结果 互 为 对 方 产生 的 





原因 之 所 以 如 此 重要 ， 关 键 理 由 之 一 是 我 们 可 以 禾 
效 的 干预 措施 ， 从 而 控制 我 们 周 上 
助 我 们 找到 事件 发 生 的 原因 。 在 前 面 的 心理 学 实验 





目的 世界 。 














1, 我 们 巧妙 地 ; 





上 用 它 来 设计 出 有 
日 是 ,干预 措施 也 能 反 过 来 帮 


这 个 











世界 划分 成 了 各 种 可 能 的 原因 和 结 


时 , 我 们 控制 这 些 因 素 ， 


的 结果 ， 这 样 就 能 区 分 出 那些 看 似 相同 的 因 环 











日 





HAN 


。 当 不 知道 哪个 是 原因 哪个 是 结果 
并 测试 当 出 现 或 缺少 不 同 的 因素 时 会 出 现 什么 样 









































结构 。 一 些 研究 发 现 ， 如 果 


我 们 允许 参与 者 去 干预 一 个 体系 的 运转 过 程 而 不 仅仅 是 让 他 们 观察 , 那么 





























他 们 推理 因果 关系 的 准 硬 























有 一 项 研究 用 一 个 


有 两 个 上 从 轮 和 一 个 开关 , 所 以 
个 齿轮 转动 、 开 关 让 两 个 齿轮 分 别 转动 、 帮 





度 就 会 提高 。” 








简单 的 齿轮 玩 














rbb 


E KE 


























具 验 证 了 上 述 结 论 。 因 为 这 个 玩具 
够 实现 多 种 因果 


结构 : 一 个 齿轮 让 男 一 


F 关 让 两 个 齿轮 一 起 转动 。 学 龄 








34 ， 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 






































前 儿童 仅 通过 观察 他 人 对 这 个 玩具 的 干预 就 能 了 解 这 些 更 为 复杂 的 因果 
结构 。” 然 而， 看 和 做 (观察 和 和 干预 ) 是 有 差别 的 ， 自 己 实施 干预 和 看 别 
人 实施 干预 也 是 有 差别 的 。 当 你 自己 选择 并 实施 了 一 项 干预 措施 时 , 你 可 
以 提出 假设 并 进行 验证 ， 并 且 能 够 控制 那些 你 认为 可 能 影响 结果 的 因素 。 
事实 上 , 在 有 些 实验 中 , 无 论 是 儿童 还 是 成 人 参与 者 都 能 从 自己 的 干预 活 
动 (而 不 是 他 人 实施 的 干预 活动 ) 中 更 好 地 把 握 事物 之 间 的 因果 结构 。” 


















































2.2 ”责任 的 划分 


假如 你 有 一 台 非 常 考究 的 咖啡 机 ， 这 台 机 器 的 热度 达到 蔡 取 咖啡 的 
要 求 之 后 只 能 持续 很 短 的 时 间 ， 你 必须 在 机 器 过 热 之 前 把 咖啡 萃取 出 来 。 
你 的 朋友 在 鞋 取 了 一 杯 咖 啡 后 没有 关机 器 ， 你 去 萃取 咖啡 的 时 候 机 器 已 经 
过 热 , 所 以 那天 早上 你 没 喝 成 咖啡 。 那么 , 是 谁 造 成 你 那天 没 喝 成 咖啡 的 ? 
是 因为 你 的 朋友 没有 早点 关 掉 咖啡 机 ， 还 是 因为 厂家 生产 了 一 台 有 缺陷 、 
不 能 重度 使 用 的 机 器 ? 

这 就 是 因果 关系 中 的 归 因 问题 : 要 确定 是 谁 或 者 是 什么 导致 了 特定 
的 事件 。 也 就 是 说 ， 我 们 想 知道 的 不 是 一 般 情况 下 咖啡 机 出 故障 的 原因 ， 
而 是 这 个 案例 中 的 咖啡 机 为 什么 会 出 故障 。 这 与 我 们 分 析 交 通 事故 中 的 责 
任 , 或 者 分 析 某 人 为 什么 开会 迟到 是 同一 种 类 型 的 推理 活动 。 这 种 类 型 的 
因果 关系 称 为 实证 式 因 果 关 系 (as token causality )， 与 类 级 别 因果 关系 
(type-level causality ) 刚好 相反 。 类 级 别 因果 关系 指 的 是 一 般 情况 下 会 出 现 
的 情况 。 比 如 ， 因 分 心 驾驶 而 导致 的 交通 事故 ,与 Susie 在 开车 时 发 短信 结 
果 撞 上 了 Billy 的 车 是 不 同 的 。 我 们 将 在 第 8 章 深入 讨论 实证 式 因 果 关 系 。 
不 过 ， 在 进行 责任 划分 时 ， 我 们 不 能 单单 列 出 可 能 引发 事故 的 各 种 
原因 ， 还 要 考虑 道德 因素 或 过 失 程度 。 此 外 ,有 些 事件 中 可 能 存在 因果 关 
AR, 但 这 里 面 的 原因 并 没有 实际 的 责任 。 比 如 说 ,你 导致 了 一 场 交 通 事故 
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却 不 用 承担 责任 , 因为 你 当时 及 时 踩 了 刹车 , 但 因为 刹车 失灵 而 撞 上 了 为 
一 辆 车 ,这 时 你 是 没有 责任 的 ( 我 们 将 在 第 8 章 解 释 为 什么 这 可 能 是 汽车 























生产 商 的 责任 )。 关 于 责任 划分 和 归 因 问题 的 研究 大 多 是 在 哲学 领域 进行 
AY, 但 这 些 研 究 通常 基于 直觉 或 者 人 们 “应 该 会 ” 有 的 想法 ， 而 不 是 通过 
实验 收集 的 数据 。 比 如 我 们 所 说 的 “ 笔 的 问题 "。 某 大 学 哲学 系 有 一 名 接 
待 员 , 她 的 办 公 桌 里 装 满 了 笔 。 行政 助理 们 需要 用 笔 的 时 候 直接 从 接待 员 
那里 拿 就 可 以 了 , 但 是 教授 们 则 需要 自己 买 笔 。 但 实际 上 , 教授 和 助理 都 
会 从 接待 员 那 里 拿 笔 。 有 一 天 , 一 名 教授 和 一 名 行政 助理 拿 走 了 接待 员 手 














中 最 后 的 两 支 笔 。 然后 , 接待 员 接 到 了 















































通 重要 的 电话 , 结果 却 没有 笔 来 


记 电 话 中 的 内 容 。 这 个 情况 是 谁 造成 的 呢 ? ” 
关于 这 个 问题 ， 每 个 人 的 直觉 可 能 不 一 样 。 我 们 并 不 清楚 人 们 对 这 





























个 问题 的 主导 性 看 法 是 什么 , 也 不 知道 这 个 问题 是 否 有 正确 答案 。 研究 这 
些 问题 的 哲学 家 常常 假定 人 们 对 这 些 问题 有 一 个 共同 的 直觉 。 心 理学 家 则 
通常 通过 实验 来 验证 这 些 观点 , 但 是 大 多 数 实验 的 参与 者 都 是 大 学 生 , 所 
以 我 们 无 法 确定 能 否 由 此 推断 出 整个 人 群 的 道德 考量 ( 可 能 大 学 生 对 行政 
















































































助理 和 大 学 教授 的 道德 问题 有 强烈 的 先 人 为 主 的 情感 ) 人 们 用 实验 法 来 
回答 哲学 问题 的 做 法 已 经 越 来 越 常见 , 并 且 时 常用 实验 法 去 验证 一 些 通常 








被 认为 理所当然 的 直觉 , 这 就 催生 了 哲学 上 的 一 个 分 支 一 一 实验 哲学 。 实 

















验 哲学 的 主要 研究 领域 之 一 正 是 这 类 道德 评判 , 而 这 也 是 哲学 和 心理 学 研 


究 的 交叉 领域 。 





有 一 个 重要 发 现 叫 作 “副作用 效应 

















”( 也 叫 “ 诺 布 效应 ”) 7, CWE 


要 内 容 是 , 如 果 某 个 人 的 行为 无 意 间 带 来 了 积极 的 效应 ， 人 们 不 会 将 这 种 
效应 归功 于 这 些 行为 ; 但 如 果 这 个 人 的 行为 无 意 间 带 来 了 消极 效应 , 那么 
人 们 就 会 认为 这 些 行为 是 有 意 的 ， 并 且 将 责任 归咎 于 这 些 行为 的 发 出 者 。 
有 一 项 实验 告诉 参与 者 : 公司 的 CEO 并 不 关心 他 们 关于 提高 利润 的 最 新 
提案 是 否 对 环境 有 利 , 他 们 只 关心 利润 。 结 果 当 环境 遭 到 破坏 时 ,参与 者 
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往往 会 责怪 这 位 CEO; 但 是 当 环境 得 到 改善 时 ， 参 与 者 却 并 没有 表扬 这 
位 CEO。 人 们 又 做 了 类 似 的 实验 并 得 到 了 同样 的 结果 : 无 意 间 带 来 积极 
效应 的 行为 不 会 得 到 表扬 , 但 无 意 间 带 来 消极 效应 的 行为 却 会 受到 批评 。” 
心理 学 家 的 实验 表明 , 与 无 意 的 行为 相 比 , 有 意 的 行为 更 容易 成 为 事件 的 
原因 和 责任 主体 。” 这 项 研究 很 有 名 ， 因 为 实验 的 参与 者 不 是 大 学 生 ， 而 
是 纽约 一 个 公园 里 的 人 , 但 研究 人 员 并 没有 告诉 我 们 这 些 参与 者 的 所 属 区 
域 及 人 口 特征 方面 的 信息 。?” 

我 们 要 了 解 的 关于 “动机 ”的 第 二 个 方面 是 ， 人 们 想 要 得 到 的 结果 
和 实际 产生 的 结果 之 间 的 差别 。 正 如 驾驶 员 试 图 把 车 停 下 来 却 因为 机 械 故 
障 而 没 能 停 下 一 样 ， 有 时 候 人 的 动机 可 能 是 好 的 , 但 结果 却 是 坏 的 。 如 果 
某 个 人 的 动机 是 好 的 , 但 他 的 行为 却 带 来 了 不 好 的 结果 , 那么 他 是 否 应 该 
象 那些 有 意 造成 不 良 后果 的 人 一 样 受到 责备 呢 ? 针对 这 类 问题 的 一 些 研 
FEA, 动机 与 结果 之 间 的 相互 作用 比 道德 评价 与 结果 之 间 的 相互 作用 更 
能 解释 人 们 的 评判 。 举 个 例子 , 某 人 有 意 造 成 某 种 伤害 但 没有 成 功 , 却 有 
人 因为 其 他 原因 而 受到 了 伤害 。 与 没有 任何 人 受到 伤害 的 情况 相 比 , 在 这 
种 情况 下 ， 人 们 划分 给 有 意 造 成 伤害 的 人 的 责任 要 少 一 些 。” 考 虑 到 这 一 
结果 , RAAPA AESA AEIR AA EIERE RIA ASET 
要 少 一 些 一 一 尽管 试图 作 次 的 人 都 会 受到 责备 。 

关于 副作用 效应 的 解释 有 两 种 : 一 种 是 它 取 决 于 人 们 的 行为 是 否 是 
有 意 的 ， 男 一 种 是 人 们 的 行为 是 否 违反 了 社会 规范 。” 如 果 你 的 行为 符合 
社会 规范 (考试 不 作弊 、 不 乱 扔 垃圾 ， 等 等 )， 那么 你 不 会 因为 自己 的 行为 
而 受到 褒奖 ， 因 为 这 是 正常 行为 。 然 而 ， 如 果 你 为 了 走 捷径 而 踩 了 一 些 花 
草 ， 就 会 受到 责备 ， 因 为 你 的 行为 违反 了 社会 行为 标准 。 有 一 个 违背 了 社 
会 规范 却 没 有 造成 任何 后 果 的 例子 一 一 在 没有 任何 车 辆 行驶 的 、 空 旷 的 柏 
林 街 头 ， 在 没有 斑马 线 的 地 方 横 穿 马路 ( 这 种 行为 在 柏林 是 不 允许 的 ), 在 
这 个 例子 中 ， 没 有 任何 造成 伤害 的 动机 ， 也 没有 人 受到 任何 伤害 ， 但 是 它 
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依然 违背 了 社会 规范 。 我 们 通常 不 会 因为 没有 发 生 的 事 而 去 问 责 ， 但 是 这 
种 行为 可 能 会 受到 责备 ， 因 为 这 样 有 可 能 会 造成 伤害 。 这 也 许 就 是 不 遵守 
交通 规则 的 人 会 被 别人 责 加 的 原因 。 
有 一 个 实验 明确 地 验证 了 行为 规范 、 对 行为 的 道德 评判 和 行为 结 
之 间 的 关系 。“ 在 这 个 实验 中 ， 有 一 组 学 生 拿 到 了 期 末 试 卷 。 我 们 可 以 根 
据 同 一 问题 的 不 同 答案 而 得 到 不 同 的 情形 。 首 先 , 大 部 分 学 生 可 以 选择 作 
em ee AN EME. SG, —744 04 John Granger 的 学 生 可 以 选择 随 大 流 (大 
PSP ATEN ABENE , ABO AAS PEE ALAS PEE 或 者 不 随 大 流 ( 大 
MBSA PERRET ABA ERE, TaD AAS EBERLE BE). 在 他 的 考试 成 绩 和 
评分 机 制 的 双重 作用 下 , 期 末 考 试 成 绩 仅 次 于 他 的 那个 同学 ,因为 一 线 之 
差 而 没有 达到 医学 院 要 求 的 最 低 平均 绩 点 ( GPA )。 那 么 问题 来 了 ， 如 果 
John Granger 需要 承担 责任 ， 那 么 他 是 在 什么 情况 下 造成 了 这 一 结果 的 ? 
有 趣 的 是 ， 规 范 性 并 没有 对 因果 关系 或 责任 划分 产生 过 多 的 影响 。 相 反 ，， 
参与 者 的 判定 主要 依据 他 们 对 Granger 行 为 的 评估 ,如 果 他 们 认为 Granger 
的 行为 很 坏 ， 那 么 这 种 行为 就 更 能 引起 这 样 的 结果 ， 也 更 应 该 加 以 谴责 。 
然而 ， 当 大 部 分 参与 者 都 作 次 而 Granger 没有 作 数 时 ， 人 们 就 会 认为 他 的 
ITHNE TZANEEN. 
有 证 据 表 明 ， 影 响 责任 判 定 的 因素 有 很 多 ， 比 如 规范 、 动 机 和 结 
等 , 然而 做 出 这 些 判 定 的 过 程 还 在 研究 当中 。 尽 管 近期 的 研究 将 责任 判定 
当 作 了 一 种 包含 多 个 步骤 和 流程 的 社会 行为 , 但 是 绝 大 部 分 实验 研究 还 是 
主要 关注 结果 并 致力 于 理解 各 种 直觉 。” 










































































































































































2.3 文化 








当 有 些 研 究 指 出 “90% 的 参与 者 都 认为 是 那个 司机 引起 了 这 场 交 通 事 
故 ” 时 , 这 里 的 参与 者 指 的 是 什么 人 ? 心理 学 研究 的 绝 大 部 分 参与 者 都 是 
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西方 大 学 生 。“ 这 并 不 奇怪 ， 因 为 这 个 领域 的 大 部 分 研究 工作 都 是 在 高 校 
开展 的 , 我 们 通常 都 能 找到 足够 的 学 生 参 与 者 。 某 些 情况 下 可 能 会 存在 一 
种 普遍 的 现象 , 但 这 并 不 意味 着 每 个 人 所 感知 的 、 所 判定 的 因果 关系 都 是 
一 样 的 , 更 不 要 说 那些 18 岁 到 21 岁 的 大 学 生 了 。 这 就 限制 了 我 们 所 讨论 
的 那些 研究 成 果 的 普遍 适用 性 。 为 了 了 解 这 个 问题 的 影响 , 有 些 研 究 人 员 
对 比 了 不 同文 化 背景 的 参与 者 对 因果 关系 的 感知 和 判定 。 

一 个 重要 的 文化 差异 是 ， 参 与 者 认为 哪些 因素 与 结果 存在 因果 相关 
性 。”“ 如 果 某 个 游泳 运动 员 赢得 了 一 次 奥运 比赛 ， 人 们 可 能 会 说 她 之 所 以 
能 获胜 是 因为 参赛 运动 员 的 总 体 实力 比较 弱 , 或 者 是 因为 她 有 家 人 的 支持 
(环境 因素 )， 或 者 是 因为 她 有 游泳 天 赋 (个 人 豪 赋 )。 这 些 因 素 可 能 都 为 
她 的 成 功 做 出 了 贡献 , 但 是 差别 在 于 哪些 因素 是 最 重要 的 。 为 了 验证 这 一 
点 ，Michael W. Morris 和 Kaiping Peng (1994) 分 析 了 汉语 报纸 和 英文 报 
纸 上 关 于 同样 的 一 些 刑事 案件 的 报道 , 他 们 发 现 英文 报纸 上 提 到 性 格 因素 
( 比如 久 | 手 十 分 愤怒 ) 的 比例 要 比 中 文 报纸 高 得 多 ， 而 中 文 报纸 则 往往 强 
调 环境 因素 ( 比如 凶手 刚刚 失业 )。Michael W. Morris 和 Kaiping Peng 还 
让 中 国学 生 和 美国 学 生 对 各 种 影响 因素 的 重要 性 进行 了 评分 , 结果 与 上 述 
研究 一 致 。 在 其 他 针对 东西 方 文 化 的 对 比 研究 中 ， 人 们 也 发 现 了 同样 的 
现象 。” 

然而 ， 这 些 文化 差异 似乎 还 会 随 着 年 龄 的 增长 而 发 生变 化 。Joan 
Miller ( 1984 ) 是 第 一 批 研究 这 一 现象 的 研究 者 之 一 ， 她 对 比 了 四 个 不 同 
年 龄 段 (8 岁 、11 岁 、15 岁 及 成 年 人 ) 的 印度 参与 者 和 美国 参与 者 ， 发 现 
在 8 岁 和 11 岁 这 两 个 群体 中 ， 印 度 参与 者 和 美国 参与 者 几乎 没有 差异 。 
研究 者 让 这 些 参 与 者 解释 一 下 他 们 所 认识 的 某 个 人 为 什么 会 做 好 事 , 另 一 
个 人 又 为 什么 会 做 坏事 ， 年 龄 越 大 的 美国 参与 者 越 强 调 个 性 特征 的 作用 
( 比如 这 个 朋友 心地 比较 善良 ), 而 年 龄 越 大 的 印度 参与 者 则 越 强 调 环境 的 
作用 ( 比如 他 刚刚 换 了 工作 )， 其 中 成 年 美国 参与 者 和 成 年 印度 参与 者 的 
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差别 最 大 。 这 可 能 是 因为 人 们 的 观点 真 的 随 着 年 龄 的 增长 发 生 了 变化 , 也 
可 能 是 因为 随 着 年 龄 的 增长 ,人 们 越 来 越 明 白 自己 该 说 什么 ,不 该 说 什么 。 
我 们 知道 仅仅 参与 一 项 研究 也 能 影响 人 们 的 行为 , 因为 参与 者 可 能 会 尽量 
按照 他 们 所 理解 的 研究 者 的 信念 做 事 ( 就 是 尽量 让 研究 者 高 兴 )， 也 可 能 
会 与 研究 者 对 着 干 。 在 一 项 研究 中 , 研究 者 仅仅 改变 了 问卷 的 抬头 就 导致 
参与 者 的 答案 重心 发 生 了 变化 。”“ 

在 归 因 问题 上 ， 社 会 暗示 似乎 会 对 人 们 所 强调 的 因素 ( 比如 新 闻 中 
报道 的 内 容 ) 产 生 一 定 的 影响 ,并 且 对 人 们 如 何 描 述 这 些 因素 的 重要 性 ( 环 
境 和 个 性 的 影响 程度 有 多 大 ) 也 有 一 定 的 影响 。 但 是 , 这 一 现象 背后 的 作 
用 机 制 却 无 人 知晓 。 不 久 前 , 一 些 证 据 表明 人 们 对 熏 论 的 认识 ( 你 认为 你 
所 处 的 社会 群体 会 持 什么 样 的 观点 ) 会 对 文化 差异 产生 影响 。 ”也 就 是 说 ， 
尽管 这 些 研 究 的 结果 与 早期 Morris 和 Peng 的 发 现 是 一 致 的 ， 但 是 这 些 参 
与 者 实际 上 可 能 持 有 同样 的 观点 , 只 不 过 他 们 所 认为 的 全 体 中 国人 的 观点 
和 他 们 所 认为 的 全 体 美 国人 的 观点 不 同 而 已 , 而 这 种 对 群体 所 持 观 点 的 认 
识 可 能 解释 了 他 们 为 什么 会 做 出 不 同 的 判断 。 

现在 我 们 似乎 明确 了 一 点 : 人 们 对 交通 事故 (一 个 涉及 很 多 社会 与 
文化 因素 的 事件 ) 中 的 过 错 方 可 能 会 有 不 同 的 判断 。 反对 分 心 驾驶 的 人 可 
能 会 抓 住 驾驶 员 开 车 时 发 短信 这 个 事实 不 放 , 另 一 个 人 可 能 会 因为 汽车 制 
动 系统 故障 而 认为 是 汽车 制造 商 的 过 错 。 有 人 假设 , 个 人 主义 文化 和 集体 
主义 文化 的 差异 是 导致 归 因 差异 的 根源 , 所 以 这 种 差异 只 会 体现 在 我 们 对 
社会 性 事件 (动物 群体 或 人 类 群体 之 间 的 互动 ) 的 感知 当中 ， 而 不 会 体现 
在 对 物理 性 事件 ( 物体 的 移动 ) 的 感知 当中 。 我们 对 物理 事件 的 感知 似乎 
不 会 受到 文化 差异 的 影响 ,但 最 近 有 研究 发 现 ， 人 们 在 感知 物理 事件 时 ， 
眼球 的 运动 存在 文化 上 的 差异 ( 不 同文 化 的 人 可 能 会 将 注意 力 放 在 同一 场 
景 的 不 同位 置 上 )。” 
























































































































































40 | 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 

















2.4 人 的 局 限 性 




















尽管 我 们 的 一 个 主要 目标 (也 是 长 远 目标 ) 是 设计 出 能 够 复制 人 类 
思维 的 算法 , 但 是 人 类 思维 在 很 多 方面 都 不 如 计算 机 程序 , 因为 计算 机 程 
序 的 运算 行为 是 完全 可 控 的 , 并 且 能 够 完全 依照 制定 好 的 规则 来 运行 。 R 
然 我 们 能 够 从 很 少 的 观察 数据 中 快速 找到 因果 关系 , 但 是 我 们 所 找到 的 
果 关 系 并 不 总 是 正确 的 。 更 令 人 苦恼 的 是 ,我们 经 常会 犯 同样 的 错误 ， 即 
便 我 们 已 经 意识 到 了 这 一 点 。 第 3 章 会 讲 到 , 很 多 认 知 偏见 会 导致 我 们 看 
到 一 些 并 不 存在 的 相关 性 , 因为 我 们 经 常会 寻找 一 些 信息 来 证 实 自己 的 信 
念 ( 比如 找 一 些 同 样 觉得 针 儿 有 效果 的 人 )， 或 者 更 重视 那些 能 够 证 实 我 
们 信念 的 信息 ( 比如 在 收银 台 排 队 时 ， 我 们 只 会 注意 到 比 自己 的 队伍 结 
账 速度 快 的 队伍 )。 有些 因 素 让 人 们 很 难 把 握 事 件 发 生 的 原因 ， 比 如 原因 
和 结果 之 间 存 在 很 长 的 延迟 , 或 者 因果 结构 很 复杂 。 这 些 因素 要 求人 们 解 
开 很 多 复杂 的 关联 关系 , 同时 还 可 能 会 让 事件 之 间 的 联系 变 得 模糊 。 但 是 ， 
即便 是 面 对 一 个 原因 和 结果 之 间 没 有 延迟 的 、 简 单 的 因果 结构 , 我 们 仍 有 
可 能 在 因果 推理 过 程 中 被 某 些 廖 论 误导 。 

祸 不 单行 是 真 的 吗 ? 打 碎 一 面 镜子 就 会 带 来 七 年 的 霉 运 吗 ? 口香糖 
FAHER RILES REMEG? 在 错误 的 因果 观念 中 , 最 有 说 服 力 的 
形式 之 一 就 是 迷信 。 一 定 没 有 人 统计 过 一 个 人 在 打 碎 一 面 镜子 之 前 或 之 后 
的 七 年 中 遇 到 的 倒霉 事 , 也 没有 人 将 打 碎 镜子 的 人 群 和 没有 打 碎 镜子 的 人 
群 在 七 年 中 遇 到 的 倒霉 事 做 过 比较 。 既 然 如 此 , 为 什么 那么 多 通常 都 很 理 
性 的 人 还 会 继续 相信 这 种 说 法 呢 ? 

有 些 类 似 于 这 样 的 迷信 可 以 用 某 种 认 知 偏见 来 解释 ， 从 而 让 我 们 能 
够 识别 出 本 来 没有 联系 的 事件 之 间 被 人 为 杜撰 出 来 的 各 种 错误 的 相关 性 。 
也 就 是 说 , 人 们 之 所 以 会 在 打 碎 镜子 之 后 注意 到 更 多 倒霉 的 事情 , 是 因为 
人 们 对 这 些 事情 的 警觉 性 提高 了 。 更 糟糕 的 是 , 如 果 你 相信 之 后 会 有 七 年 






















































































~ 























































































































































































































的 霉 运 ,那么 你 可 
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能 会 把 一 般 情 况 下 不 会 注意 到 的 或 者 不 认为 是 倒 竹 的 事 








情 也 当 作 霉 运 。 但 还 有 一 些 情 况 下 ， 迷 信息 想 会 产生 一 种 安 感 剂 效应 。 





在 医学 上 ， 仅 仅 是 “接受 治疗 ”这 一 行为 就 可 能 对 病人 产生 影响 ， 
所 以 在 研究 药 效 时 








必须 找 一 个 参照 物 。 我 们 将 某 种 药物 的 疗效 与 另 一 种 类 




















似 的 、 已 知 没有 效果 的 治疗 方法 相 比较 。” 比如 说 ,我们 可 以 对 比 阿 司 匹 


























林 和 糖 丸 治疗 头 ; 

















法 的 情况 相 比较 ， 











的 效果 , 而 不 是 将 阿司匹林 的 疗效 与 不 采用 任何 治疗 方 
因为 这 样 我 们 才能 控制 服药 这 一 行为 本 身 对 病人 的 影 
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响 。 这 就 是 在 没有 
症状 减轻 了 10%” 





与 任何 治疗 方法 做 对 比 的 情况 下 , “实验 疗 法 让 病人 的 
这 种 结论 没有 任何 意义 的 原因 。 有 了 时候, 病人 已 经 知道 











了 他 们 正在 服用 安奈 剂 , 即使 这 个 安奈 剂 对 他 们 的 病症 没有 任何 帮助 , 他 
们 依然 会 发 现 安慰 剂 效 应 。” 
同样 ， 当 你 相信 自己 的 幸运 之 笔 ， 或 者 篮球 赛 前 的 一 些 仪式 能 够 帮 








助 你 得 分 时 ,它们 








就 有 可 能 真 的 带 来 这 种 效应 。 值 得 注意 的 是 , 给 你 带 来 








好 结果 的 并 不 是 这 个 物件 或 仪式 本 身 , 而 是 你 认为 这 个 物件 或 仪式 会 起 作 








用 的 信念 。 这 种 信念 会 给 你 带 来 某 些 感觉 比如 减轻 压力 或 者 胜 券 在 握 的 


= Ys, “ay by A 
感觉 ， 而 这 些 感觉 

















又 给 你 带 来 了 好 的 结果 。” 





k 
你 可 能 会 觉得 以 上 这 些 听 起 来 都 有 点 道理 ， 但 是 “7” 这 个 数字 对 你 


来 说 意义 特殊 ,而 


fa, 就 会 特别 关注 








且 这 不 是 巧合 。 你 听 到 的 所 有 好 消息 都 正好 是 分 钟 的 个 
位 数 是 7 的 时 候 , 出 现 这 种 情况 的 概率 有 多 大 呢 ? 一 旦 你 产生 了 这 样 包 
与 这 个 迷信 一 致 的 事情 , 也 更 容易 记 住 这 样 的 事情 。 











Ca 








就 是 说 , 你 会 开始 忽略 与 这 个 迷信 不 一 致 的 事情 ( 比如 与 7 无 关 的 好 事 )。 
人 们 倾向 于 去 寻找 并 记 住 一 些 证 据 , 以 此 来 支撑 自己 的 信念 , 这 种 倾向 叫 
作证 实 性 偏见 , 我 们 将 在 下 一 章 进 行 更 全 面 的 讨论 。 这 种 偏见 可 能 会 导致 
人 们 产生 一 些 无 害 的 错误 观念 ,但 也 有 可 能 会 强化 一 些 有 害 的 偏见 。 

这 有 点 像 是 成 见 威胁 现象 : 当 一 个 人 知道 自己 属于 一 个 具有 负面 特 

































































征 的 群体 时 ,他 就 会 害怕 去 证 实 那些 成 见 。 在 一 次 实验 中 ,实验 者 让 参与 
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者 做 一 份 数学 试卷 。 在 考试 前 , 实验 者 告诉 一 部 分 女性 参与 者 , 男生 和 女 
生 做 这 份 试卷 所 考 出 的 成 绩 是 不 一 样 的 ( 有趣 的 是 , 实验 者 并 没有 告诉 她 
们 到 底 是 男生 考 得 好 还 是 女生 考 得 好 )。” 然 后 又 对 另 一 部 分 女性 参与 者 
说 , 男生 和 女生 做 这 份 试卷 所 考 出 的 成 绩 没有 差别 。 结果 ,被 告知 男生 和 
女生 的 成 绩 没 有 差别 的 女性 参与 者 考 出 的 成 绩 和 男生 平分 秋色 , 而 被 告知 
男生 和 女生 考 出 的 成 绩 有 差别 的 女性 参与 者 考 出 的 成 绩 要 比 男生 差 得 多 。 
这 种 错误 的 因果 信念 可 能 会 带 来 实际 的 影响 。 我 们 在 之 后 的 章节 中 将 会 看 
到 ， 建 立 在 错误 的 因果 关系 之 上 的 政策 最 多 不 过 是 无 效 政 策 ， 而 使 用 错误 
的 因果 关系 则 可 能 会 造成 冤案 ， 正 如 我 们 在 第 1 章 看 到 的 那样 。 

一 种 无 代价 的 或 者 不 显眼 的 仪式 可 能 无 伤 大 雅 ( 手指 交 义 祈祷 似乎 并 
没有 多 大 的 害处 ), 但 这 种 行为 最 终 会 导致 人 们 去 依赖 一 种 微弱 的 联系 , 并 
有 可 能 高 估 自 己 的 力量 (一 个 人 控制 或 预测 事件 的 能 力 )。” 我 们 会 提出 
假设 并 寻找 迹象 来 证 实 这 些 怀疑 ,但 是 严谨 的 因果 思维 需要 我 们 认识 到 这 
种 行为 可 能 会 让 我 们 陷入 偏 兄 ， 并 且 必 须 接受 与 我 们 的 信念 相反 的 证 据 ， 
后 面 将 会 介绍 如 何 做 到 这 一 点 。 
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. Michotte ( 1946 ). 
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33. Lagnado 和 Sloman ( 2004 ); Steyvers 等 (2003 )。 

34. Schulz “ (2007 ) 还 有 其 他 研究 曾 将 干预 措施 的 作用 和 贝 叶 斯 网 络 的 形式 
主义 联系 在 一 起 。 人 参见 Gopnik 等 ( 2004 ); Waldmann 和 Hagmayer (2005 )。 

35. Kushnir 和 Gopnik (2005 ); Sobel 和 Kushnir ( 2006 )。 
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第 3 章 ” ”相关 性 


为 什么 有 那么 多 因果 关系 被 搞 错 ? 


2009 年 ， 研 究 人 员 发 现 一 种 叫 XMRYV 的 病毒 与 慢性 疲劳 综合 征 ! 











(CFS) 有 着 惊人 的 联系 。 尽 管 美国 有 数 百 万 人 患 有 这 种 疾病 〈 其 特征 是 
长 时 间 的 严重 疲劳 )， 却 没有 人 知道 病因 。 由 于 
的 预防 和 治疗 工作 都 遇 到 了 阻碍 。 这 种 疾病 到 底 是 由 什么 引起 的 呢 ? 人 们 
提出 了 很 多 假设 ， 其 中 包括 病毒 、 免 疫 缺 陷 、 基 因 和 压力 等 。? 然而 ， 这 种 
疾病 不 仅 病因 不 明 , 就 连 诊断 也 十 分 艰难 , 因为 无 法 通过 检测 某 个 生物 指 























标 来 确诊 。 还 有 很 多 病例 都 没有 被 发 现 ， 而 ] 


疾病 的 一 个 总 称 。° 





意 。 他 们 发 现 , 在 101 MEH 


XMRV 病毒 ; 而 在 由 218 人 组 成 的 控制 组 中 ， 











疲劳 综合 征 患 者 当 





病因 不 明 ， 所 以 这 种 疾病 
































HA Hye CFS 其 实 只 是 很 多 


在 这 种 情况 下 ,Judy Mikovits 带领 的 研究 团队 的 发 现 引起 了 人 们 的 注 














1， 有 67% 的 人 身上 带 有 























只 有 3.7% 的 人 身上 带 有 





XMRV 病毒 。 尽 管 XMRV 病毒 论 并 不 能 解释 所 有 的 病例 ， 但 可 能 有 一 部 


分 病人 的 慢性 疲劳 综合 征 就 是 由 XMRYV 病毒 3 
带 有 XMRV 病毒 的 人 也 可 能 是 没有 诊断 出 来 的 
些 数据 对 于 一 个 如 此 难以 解释 的 疾病 来 说 十 分 习 

















起 的 ， 而 且 控制 组 中 那些 


慢性 疲劳 综合 征 患者 。 这 























BB, 并且 催生 了 一 大 批 想 

















要 证 实 这 些 结论 的 研究 活动 。 很 多 研究 都 没 能 找到 慢性 疲劳 综合 征 和 
XMRV 病毒 之 间 的 联系 ,“ 但 研究 人 员 在 2010 年 发 现 了 一 种 类 似 的 病毒 ， 
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这 种 病毒 在 慢性 疲劳 综合 征 患者 身上 出 现 的 比例 (86.5%, 37 人 中 有 32 人 
带 有 这 种 病毒 ) 明显 高 于 在 健康 的 献血 者 身上 出 现 的 比例 (6.8%，44 人 
中 有 3 人 带 有 这 种 病毒 ), ”这 一 发 现 推动 了 新 一 轮 的 假设 并 众生 了 更 多 的 
研究 活动 , 研究 者 们 都 想 要 证 实 或 推翻 这 种 病毒 和 慢性 疲劳 综合 征 之 间 的 
联系 。 

人 们 假定 这 种 极 强 的 相关 性 意味 着 XMRYV 病毒 就 是 慢性 疲劳 综合 征 
的 病因 ， 所 以 针对 这 种 病毒 的 治疗 方案 也 许 能 够 最 终 治愈 慢性 疲劳 综合 
征 。 一 些 患 者 十 分 渴望 找到 一 种 治疗 方案 来 治愈 这 种 令 人 虚弱 的 不 治之 
证， 他 们 甚至 基于 对 XMRYV 病毒 的 研究 向 医生 索要 抗 逆 转录 病毒 药物 。 
很 多 慢性 疲劳 综合 征 患 者 的 血样 中 都 有 一 种 相同 的 病毒 , 这 一 发 现 十 分 有 
趣 并 且 值 得 进一步 研究 , 但 是 我 们 无 法 仅 利 用 这 一 相关 性 来 证 明 这 个 病毒 
就 是 罪魁 祸首 ， 也 无 法 证 明 抗 逆转 录 病 毒药 物 就 是 一 种 有 效 的 治疗 方案 。 
也 有 可 能 是 慢性 疲劳 综合 征 导致 免疫 系统 受 损 , 从 而 让 人 们 更 容易 感染 这 
些 病毒 。 即 便 病毒 和 疾病 之 间 存 在 某 种 因果 关系 , 这 种 很 强 的 相关 性 也 并 
不 能 告诉 我 们 前 因 后 果 一 一 这 个 病毒 到 底 是 因 还 是 果 , 还 是 说 二 者 是 由 同 
一 个 原因 导致 的 共同 结果 。 

2011 年 ， 关 于 慢性 疲劳 综合 征 和 某 种 病毒 之 间 相 关 性 的 两 项 研究 ， 
在 经 历 了 很 多 争议 和 公开 的 辩论 之 后 都 被 撤回 了 。 对 于 Mikovits 医生 的 研 
究 , 一 开始 是 部 分 撤回 , 但 最 终 还 是 由 杂志 社 在 未 经 作者 同意 的 情况 下 全 
部 撤回 了 。 “事情 是 这 样 的 ，Mikovits 医生 研究 的 血样 遭 到 了 XMRV 病毒 
的 污染 ， 导 致 两 组 样本 出 现 了 表面 上 的 差异 。 除了 样本 污染 问题 以 外 ， 
人 们 还 怀疑 可 能 存在 伪造 数据 问题 , 因为 有 一 个 图 例 省 略 掉 了 关于 如 何 准 
备 样本 的 信息 ， 并 且 有 人 指出 同一 图 例 在 不 同 的 地 方 被 贴 上 了 不 同 的 标 
签 。 此 外 ，2012 年 有 一 项 研究 邀请 了 多 个 团队 (包括 Mikovits 的 团队 ), 
各 个 团队 所 用 的 分 析 样 本 都 是 言 样 ， 研 究 结果 表明 慢性 疲劳 综合 征 和 
XMRV 病毒 之 间 没 有 任何 联系 。” 
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最 初 的 那个 发 现 引 起 了 人 们 的 极 大 关注 ， 然 后 就 极 具 戏 剧 性 地 公开 
上 演 了 各 种 分 层 。 这 一 切 都 向 我 们 展示 了 看 似 极 强 的 相关 性 能 够 带 来 的 巨 
大 影响 。 











“相关 性 不 是 因果 关系 "， 统 计 学 专业 的 学 生 对 这 句 话 已 经 烂熟 于 心 ， 
但 即使 是 那些 理解 并 且 赞 成 这 个 说 法 的 人 有 时 候 也 会 忍 不 住 把 相关 性 当 
成 因果 关系 。 研究 人 员 在 报告 相关 性 时 常常 会 附 上 很 多 说 明 , 以 此 来 解释 
为 什么 这 些 相关 性 不 是 因果 关系 , 以 及 还 缺少 什么 信息 。 但 这 些 相关 性 仍 
然 会 被 人 们 解读 成 因果 关系 , 并 被 当 作 因 果 关系 来 使 用 ( 有 时 一 篇 科技 论 
文 和 大 众 媒体 对 这 篇 论文 的 报道 之 间 都 存在 着 巨大 的 差异 )。 极 强 的 相关 
性 可 能 很 有 说 服 力 , 也 许 还 可 以 让 我 们 做 出 一 些 成 功 的 预测 ( 尽管 慢性 疫 
劳 综 合 征 的 案例 并 不 是 这 样 的 )， 但 它 无 法 告知 我 们 事物 的 工作 原理 ， 也 
无 法 告知 我 们 如 何 采取 干预 措施 来 改变 这 个 事物 的 运行 机 制 。 慢性 疲劳 综 
合 征 和 XMRV 病毒 之 间 的 表面 联系 并 不 能 说 明 我 们 能 够 用 治疗 这 个 病毒 
的 方法 来 治 好 慢性 疲劳 综合 征 ， 但 病人 却 认为 这 是 可 行 的 。 
表面 上 的 相关 性 也 许可 以 用 无 法 测定 的 原因 来 解释 ( 如果 省 略 关于 
吸烟 的 数据 ， 就 会 导致 很 多 其 他 因素 和 癌症 之 间 出 现 相关 性 )， 但 是 两 个 
本 没有 任何 关系 的 变量 之 间 也 可 能 会 出 现 一 些 虚 假 的 联系 。 相关 性 可 能 是 
巧合 (一 周 直 到 某 个 朋友 好 几 次 )， 也 可 能 是 通过 研究 方法 而 人 为 导致 的 
(调查 问卷 中 的 某 些 答案 选项 可 能 具有 偏向 性 ), 还 可 能 是 由 于 失误 和 操作 
不 当 导 致 的 〈 计算机 程序 中 的 漏洞 )。 

即便 如 此 ， 相 关 性 仍然 是 我 们 所 能 得 到 的 最 根本 的 发 现 之 一 ， 也 是 
能 证 明 因 果 关 系 的 一 个 证 据 。 在 这 一 章 ,我 们 将 探讨 相关 性 的 定义 和 用 途 ， 
以 及 一 些 出 现 相 关 性 但 背后 却 没有 因果 关系 的 情况 。 
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3.1 相关 性 是 什么 





XX 和 癌症 有 关 ，Y 和 中 风 有 关 ，Z 和 心脏 病 发 作 有 关 。 这 三 句 话 描述 
了 三 个 相关 性 , 告诉 我 们 两 个 现象 是 相关 的 , 却 没 说 它们 是 如 何 关联 在 一 
起 的 。 

两 个 变量 相关 的 基本 意思 是 ,一 个 变量 发 生 的 变化 与 男 一 个 变量 发 
生 的 变化 是 有 关联 的 。 比 如 说 ,孩子 们 的 身高 和 年 龄 相关 ， 因为 随 着 年 龄 
的 增长 ,孩子 们 的 身高 也 会 增长 , 这 样 他 们 才能 慢 慢 长 大 。 这些 相关 性 可 
能 存在 于 不 同 的 样本 之 间 (一 次 测量 多 个 不 同年 龄 的 孩子 )， 也 可 能 存在 
于 同一 样本 的 不 同时 间 段 之 间 ( 在 同一 个 孩子 的 不 同年 龄 段 多 次 测量 他 的 
身高 ), 还 可 能 存在 于 不 同样 本 的 不 同时 间 段 之 间 ( 在 多 个 孩子 的 不 同年 龄 
段 多 次 测量 他 们 的 身高 ) 然而 ， 身 高 和 出 生 月 份 之 间 却 没有 长 期 的 相关 
性 。 也 就 是 说 ， 即 使 我 们 改变 了 出 生 月 份 , 我 们 的 身高 也 并 不 会 发 生 有 规 
律 的 变化 。 图 3-1a 展示 了 年 龄 的 变化 是 如 何 与 身高 的 变化 相对 应 的 。 随 
着 一 个 变量 的 上 升 ， 另 一 个 变量 也 会 上 升 。 图 3-1b 展示 了 身高 和 出 生 月 
份 之 间 的 关系 , 这 幅 图 看 起 来 就 像 是 一 堆 随 机 放置 的 黑 点 , 而 且 身 高 并 没 
有 随 着 出 生 月 份 的 变化 而 发 生 相 应 的 变化 。 



















































































身高 身高 
(a) 存在 正 相关 性 (b) 没有 相关 性 

















图 3-1 年 龄 和 身高 是 相关 的 ， 但 身高 和 出 生 月 份 是 不 相关 的 


第 3 章 相关 性 | 49 




















这 意味 着 如 果 知道 一 个 孩子 的 年 龄 ， 我 们 就 能 大 致 预测 出 他 的 身高 ， 
但 如 果 我 们 只 知道 他 的 出 生 月 份 , 则 无 法 预测 出 他 的 身高 。 上 面 那些 黑 点 
的 排列 越 接近 一 条 直线 , 我 们 的 预测 就 会 越 准 确 ( 因为 排列 越 接近 直线 说 
明 二 者 之 间 的 相关 性 越 强 ),。 相关 性 的 主要 用 途 之 一 就 是 预测 , 而且 有 时 可 
以 在 没有 因果 关系 的 情况 下 做 出 预测 。 当 然 ， 这 些 预测 并 不 总 是 成 功 的 。 

相关 性 很 强 时 看 起 来 也 会 很 明显 ( 如 图 3-1a 所 示 ), 但 我 们 也 需要 用 
一 些 方法 来 测量 相关 性 的 强度 , 以便 对 其 进行 定量 比较 和 评估 。 表 示 相 关 
性 的 指标 有 很 多 , 但 是 最 常用 的 指标 之 一 就 是 皮尔 逊 相关 系数 ( 通常 用 字 
RE /表示 )。" 这 个 系数 的 数值 介 于 1 和 -1 之 间 ， 系 数 1 表示 变量 之 间 存 
在 完美 的 正 相关 性 (一 个 变量 发 生 正 向 变化 会 直接 引起 另 一 个 变量 发 生 相 
应 的 正 向 变化 ), 而 系数 -1 则 表示 变量 之 间 存 在 完美 的 负 相关 性 ( 如 果 一 
个 变量 减 小 ， 则 另 一 个 变量 一 定 会 增 大 )。 

简单 来 说 ， 皮 尔 逊 相关 系数 是 指 两 个 变量 如 何 通过 各 自 的 变化 而 发 
生 共 同 的 变化 ( 这 两 个 数值 称 为 协 方差 和 方差 )。 比 如 说 ， 我 们 可 以 记录 
一 组 学 生 的 学 习 时 间 和 期 末 考 试 成 绩 , 以 便 了 解 二 者 之 间 的 关系 。 如 果 我 
们 只 有 一 组 考试 成 绩 的 数据 和 一 组 学 习 时 间 的 数据 , 而 没有 将 相应 的 考试 
成 绩 和 学 习 时 间 一 一 对 应 , 那 就 无 法 确定 二 者 之 间 是 否 具 有 相关 性 。 这 是 
因为 我 们 只 能 看 到 个 体 在 每 一 个 变量 上 的 变化 , 而 没有 看 到 这 两 个 变量 是 
如 何 共同 发 生变 化 的 。 也 就 是 说 , 我 们 无 法 得 知 更 长 的 学 习 时 间 是 否 对 应 
更 高 的 考试 成 绩 。 
3.1.1 没有 变化 就 没有 相关 性 

比如 说 ， 你 想 知道 如 何 写 申 请 才能 获 批 某 项 资助 ， 所 以 就 去 找 所 有 
请 到 这 项 资助 的 朋友 , 询问 他 们 自 认 为 让 他 们 成 功 获 批 的 因素 。 这 些 朋 


友 在 资助 申请 中 都 用 了 Times New Roman 字体 ， 其 中 有 一 半 人 说 每 页 至 少 
要 有 一 个 图 表 ， 还 有 三 分 之 一 的 人 建议 你 在 截止 日 期 的 前 一 天 提交 申请 。 
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BY, 因为 结果 没有 发 生变 化 , 所 以 我 们 无 法 确定 是 否 还 有 其 他 因素 和 结果 
有 关 。 如 果 我 们 观察 到 在 连续 几 个 气温 为 华氏 80 度 的 日 子 里 ， 街 道 的 某 
个 拐角 处 都 正好 有 两 个 冰淇淋 小 贩 ,我 们 不 能 由 此 就 对 天 气 和 冰淇淋 小 贩 
之 间 的 相关 性 发 表 任何 看 法 ， 因 为 这 两 个 变量 的 数值 (气温 或 者 冰淇淋 
小 贩 的 数量 ) 都 没有 发 生 过 变化 。 同 样 ， 如 果 我 们 只 看 到 一 个 变量 发 生 了 
变化 ( 比如 冰淇淋 小 贩 的 数量 总 是 两 个 , 但 气温 却 在 华氏 80 度 到 90 度 之 





























ay 








引发 生变 化 )， 也 不 能 得 出 任何 结论 。 图 3-2 所 示 的 正 是 这 种 情况 ， 没 有 
发 生变 化 的 数据 在 图 中 是 一 个 不 变 的 黑 点 , 而 只 有 一 个 变量 发 生变 化 则 呈 

















现 为 一 条 横 线 。" 之 前 那个 申请 资助 的 例子 也 是 如 此 。 因 为 所 有 的 结 呈 

















是 一 样 的 , 所 以 我 们 无 法 预测 如 果 改 变 字 体会 出 现 什么 情况 , 也 无 法 预测 








如 果 正 好 在 截止 时 间 之 前 的 那 一 刻 提交 申请 书 会 出 现 什 么 情况 。 








2 ° 2 esses 
80 80 90 
“cl 气温 
(a) 没有 变化 (b) 一 个 变量 发 生 了 变化 
图 3-2 如 果 两 个 变量 没有 共同 发 生 改 变 , 我 们 就 无 法 找到 它们 之 间 
的 相关 性 


然而 ， 大 部 分 人 都 只 关心 导致 某 个 结果 的 原因 是 什么 。 比 如 入 们 常 





























常会 问 那些 成 功 人 士 是 如 何 取得 成 功 的 , 然后 试图 通过 复制 他 们 的 做 法 来 
取得 成 功 。 这 一 做 法 从 很 多 方面 来 讲 都 是 存在 严重 问题 的 ,比如 人 们 不 善 


于 分 辩 哪 些 因素 是 重要 的 , 哪些 因素 是 不 重要 的 , 并 且 往 往 会 低估 机 遇 的 





重要 性 而 高 估 自 己 的 技能 。 “于 是 ,我 们 会 将 那些 仅仅 与 我 们 所 关心 的 结 
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果 同 时 出 现 的 因素 误 认 为 是 导致 这 种 结果 的 因素 , 而 且 还 会 发 现 一 些 并 不 


存在 的 表面 联系 。 











有 人 曾经 问 过 : 人 们 在 其 他 领域 所 








取得 的 专业 性 成 就 与 他 们 所 接受 


的 音乐 教育 之 间 是 否 存在 相关 性 ? 即便 很 多 成 功 人 士 〈 无 论 我 们 如 何 定 
义 成 功 ) 也 会 演奏 乐器 , 我 们 也 不 能 说 这 二 者 之 间 就 存在 相关 性 一 一 更 不 
要 说 因果 关系 了 。 如 果 我 们 直接 去 访问 一 些 成 功 人 士 , 问 问 他 们 是 否认 为 






































音乐 有 助 于 提升 他 们 的 其 他 能 力 , 那么 一 定 有 很 多 人 能 从 这 两 件 事 之 间 归 





























纳 出 一 些 联系 。 但 是 , 如 果 我 们 问 他 们 是 否认 为 下 棋 、 跑 步 或 者 喝 咖 啡 有 
助 于 提高 他 们 的 其 他 能 力 ， 他 们 也 完全 能 找到 一 些 联系 。 











对 这 本 书 来 说 最 关键 的 是 ， 我 们 不 








能 仪 仅 调 查 那 些 成 功 者 所 谓 的 秘 











th, 因为 有 些 人 可 能 做 了 完全 相同 的 事情 却 没 有 获得 成 功 。 也 许 所 有 申请 
资助 的 人 都 用 了 Times New Roman 字体 (所 以 如 果 我 们 去 询问 那些 没有 
成 功 的 人 ， 他 们 会 建议 我 们 使 用 其 他 字体 )， 也 许 这 些 成 功 者 使 用 了 过 多 









































的 图 形 但 依然 得 到 了 资助 。 如 果 不 能 全 首 











i 分 析 成 功 的 例子 和 失败 的 例子 ， 


























我 们 甚至 都 不 能 确定 事物 之 间 是 否 存 在 相关 性 。 





3.1.2 ”相关 性 的 测量 与 解释 











比如 我 们 调查 了 一 些 学 生 在 期 末 考 试 前 喝 了 多 少 杯 咖啡 ,然后 义 记 
录 了 他 们 的 期 末 考 试 成 绩 。 这 个 案例 的 假设 数据 如 图 3-3a 所 示 ， 两 个 变 
量 之 间 的 相关 性 非常 高 ， 相 关系 数 接近 1 ( 确切 地 说 是 0.963 )， 所 以 图 上 
的 黑 点 似乎 紧 紧 地 聚 在 一 条 无 形 的 直线 两 侧 。 如 果 我 们 将 这 一 关系 反 过 来 
(于 是 不 喝 咖 啡 的 学 生 考 试 成 绩 成 了 92 分 ， 而 喝 10 杯 咖啡 的 学 生 考试 成 
绩 则 为 10 分 )， 建 立 一 种 负 向 联系 ,那么 相关 变量 的 变化 幅度 是 一 样 的 ， 
唯一 改变 的 就 是 相关 系数 的 符号 。 在 这 种 情况 下 , 这 个 相关 系数 会 接近 -1 
(0.963 )， 刚 好 是 正 相关 数 据 图 水 平 翻转 过 来 的 样子 (如 图 3-3b 所 示 )。 
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果 关 系 简 易 入 门 











100 100 
80 ° -is gje ° 
区 e = e 
a 60 : = 60 e 
aR ee ag ee 
ye 40 ye 40 
20 : 20 “a 
2 4 6 8 10 2 4 6 8 10 
喝 咖啡 的 杯 数 喝 咖 啡 的 杯 数 
(a) 高 度 正 相 关 (r= 0.963) (b) 高 度 负 相 关 (r= —0.963) 


考试 成 绩 
考试 成 绩 





喝 咖 啡 的 杯 数 喝 咖 啡 的 杯 数 
(c) 弱 度 正 相 关 (r= 0.788) (d) 弱 度 负 相关 (r= -0.788) 
100 
80 
60 
40 
20 


考试 成 绩 





喝 咖 啡 的 杯 数 
(e) 没有 相关 性 (r=0) 


图 3-3” 喝 咖啡 的 杯 数 和 考试 成 绩 之 间 不 同 强 度 的 相关 性 


如 果 将 每 两 个 变量 之 间 的 关系 都 变 得 更 弱 一 些 〈 每 次 喝 同样 杯 数 的 
咖啡 ， 但 考试 成 绩 的 变化 更 大 )， 那 么 这 些 黑 点 就 会 更 为 分 散 ， 变 量 之 间 
的 相关 性 也 会 更 低 。 如 图 3-3c 所 示 ， 图 中 的 黑 点 绝 大 部 分 仍然 呈 直 线 排 
列 , 但 是 偏离 中 心 的 距离 却 要 远 得 多 。 我 们 再 一 次 将 两 个 变量 之 间 的 关系 
调转 过 来 ( 让 喝 咖啡 与 更 差 的 考试 成 绩 相 关 )， 然 后 就 得 到 了 图 3-3d, W 
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张 图 唯一 的 区 别 在 于 一 个 是 上 坡 面 ， 男 一 个 是 下 坡 面 。 


注意 ， 当 一 个 变量 与 另 一 个 变量 之 间 的 关系 变 弱 时 ， 要 根据 喝 咖 啡 
的 数值 来 找到 考试 成 绩 就 难 多 了 , 反之 亦 然 。 这 一 点 从 图 上 也 可 以 明显 地 









































看 出 来 , 在 前 两 个 例子 中 , 选择 一 个 变量 的 数值 极 大 地 限制 了 男 一 个 变量 











可 能 的 数值 。 然 而 ,如果 我 们 在 相关 性 较 弱 的 情况 下 , 试图 预测 一 个 人 喝 
了 四 标 咖 啡 后 可 能 会 考 出 的 成 绩 , 那么 我 们 的 预测 将 远 远 不 及 前 面 的 例子 
那么 准确 ， 因 为 这 时 喝 四 杯 咖 啡 的 人 考试 成 绩 变化 的 范围 比 之 前 要 大 得 





多 。 变 量 之 间 这 种 不 断 增 加 的 变化 的 极限 就 是 变 成 两 个 完全 不 相关 的 变量 


( 相关 系数 为 零 ， 如 图 3-3e 所 示 )， 在 这 种 情况 下 
咖啡 数量 来 对 考试 成 绩 做 出 任何 预测 。 



































， 我 们 将 无 法 根据 饮用 的 


如 果 我 们 想 知 道人 们 居住 的 位 置 和 是 否 开车 之 间 有 多 强 的 相关 性 ， 





应 该 怎么 做 ? 到 目前 为 止 ,我 们 介绍 的 测量 相关 性 的 方法 一 般 都 用 于 测量 
连续 值 数 据 〈 比如 股票 价格 )， 而 不 用 于 测量 离散 值 ( 比如 位 置 类 型 或 电 





















































影 类 型 )。 如 果 我 们 只 有 两 个 变量 ， 而 且 每 个 变量 只 有 两 个 值 ， 那 我 们 就 
Phi 相关 系数 。 























可 以 用 皮尔 逊 相关 系数 的 简化 版 








比如 说 ,我们 可 以 测试 人 们 的 居住 位 置 和 是 否 开车 之 间 的 相关 系数 。 





























位 置信 息 要 么 是 市 区 , 要 么 是 郊区 或 乡下 ,而 开车 情况 则 要 么 是 开车 , 要 
么 是 不 开车 。 和 之 前 一 样 ， 我 们 要 测试 这 些 因素 是 如 何 共 同 发 生 改 变 的 ， 

















但 此 处 的 “改变 ” 指 的 是 我 们 看 到 这 两 个 变量 共 























绝 大 部 分 数据 是 否 落 在 了 表格 的 对 角 线 上 。 所 以 




















同 出 现 的 频率 ( 而 不 是 这 





两 个 数值 如 何 增 减 )。 表 3-1 展示 的 是 数据 可 能 会 呈现 出 的 样子 。 在 这 个 
表格 中 ， 数 据 的 Phi 相关 系数 是 0.81。 而 我 们 主要 观察 的 是 , 测量 出 来 的 




















， 如 果 绝 大 部 分 数值 都 聚 


集 在 “开车 / 非 市 区 ”和 “不 开车 /市 区 ”周围 ， 那 么 这 两 个 变量 之 间 就 存 























在 正 相 关 性 。 如 果 绝 大 部 分 数值 都 聚集 在 另 一 条 
变 , 但 是 相关 系数 前 的 符号 相反 。 








对 角 线 上 , 那么 相关 性 不 
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表 3-1 居住 位 置 和 开车 情况 的 各 种 组 合 





郊区 /乡下 市 区 
开车 92 6 
不 开车 11 73 


然而 ， 相 关 性 强 并 不 一 定 意味 着 相关 系数 也 高 。 皮 尔 逊 相关 系数 假 
定 两 个 变量 之 间 是 线性 关系 ， 即 一 个 变量 ( 比如 身高 ) 增 大 , 男 一 个 变量 
( 比如 年 龄 ) 也 会 以 相同 的 比率 增 大 。 然 而 ， 情 况 并 非 总 是 如 此 ， 因 为 还 
可 能 存在 更 为 复杂 的 、 非 线性 的 关系 。 如 果 不 喝 咖啡 会 让 人 精神 不 振 ( 并 
且 会 降低 考试 成 绩 )， 但 是 咖啡 喝 得 太 多 又 会 让 人 神经 过 敏 〈 并 且 影 响 考 
WEHE), 那么 把 我 们 收集 到 的 一 些 数据 画 出 来 可 能 就 是 图 3-4 中 的 那 条 
曲线 。 在 这 个 图 中 ,人们 喝 咖 啡 的 杯 数 从 0 增加 到 5 时 ,考试 成 绩 是 持续 
上 升 的 ， 然 后 在 5 到 10 杯 之 间 ， 考 试 成 绩 随 着 喝 咖 啡 杯 数 的 增加 而 慢 慢 
下 降 。 尽 管 这 个 案例 中 的 皮尔 逊 相关 系数 刚好 为 零 ， 但 是 这 些 数据 却 呈 现 
出 了 明显 的 规律 性 。 很 多 因果 推理 方法 都 很 难 推理 出 这 种 关系 ， 我 们 将 在 
后 面 的 章节 中 继续 讨论 这 个 问题 。 鉴 于 生物 医学 ( 比如 缺乏 维生素 或 维 生 
素 服用 剂量 过 多 都 可 能 导致 健康 问题 ) 和 金融 ( 比如 将 税率 和 收入 联系 在 
一 起 的 拉 弗 曲线 ) 等 应 用 领域 都 存在 这 一 问题 , 所 以 很 值得 我 们 去 认真 思 
考 一 下 。 

类 似 地 ， 如 果 孩 子 们 的 体重 总 是 随 着 年 龄 的 增长 而 增长 ,但 是 体重 
是 以 指数 级 增长 的 ( 随 着 年 龄 的 增长 ， 体 重 增 长 得 越 来 越 多 )， 那 么 皮尔 
还 相关 系数 会 比 想象 的 要 低 , 因为 这 个 指标 适用 的 是 线性 关系 。 这 就 好 比 
我 们 将 数据 输入 黑匣子 , 然后 不 管 黑匣子 反馈 给 我 们 的 是 什么 数字 都 不 假 
思索 地 接受 , 这 样 是 很 危险 的 。 在 这 些 相关 性 被 低估 甚至 看 起 来 是 零 的 案 
例 中 , 如 果 我 们 不 进一步 研究 就 直接 接受 这 样 的 数值 , 很 有 可 能 会 错失 一 
些 十 分 有 意义 的 关联 。 
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考试 成 绩 





喝 咖 啡 的 杯 数 








图 3-4” 非 线性 关系 (r= 0.000 ) 


这 就 是 我 们 不 能 把 相关 系数 〈 不 管 是 皮尔 逊 相关 系数 还 是 其 他 相关 
系数 ) 为 零 理 解 为 不 存在 任何 相关 性 的 部 分 原因 ( 还 有 很 多 其 他 原因 ， 比 
如 测算 中 的 失误 或 者 导致 结果 出 现 偏 差 的 异常 值 另外 一 个 主要 原因 是 ， 
我 们 所 用 的 数据 可 能 不 具 代表 性 , 不 能 反映 数据 的 基本 分 布 情况 。 如 果 只 
使 用 医院 的 入 院 数据 和 急诊 科 数 据 来 研究 流感 致死 情况 , 那 我 们 得 到 的 流 
感 死亡 率 就 会 比 社会 整体 人 群 的 实际 流感 死亡 率 高 得 多 。 这 是 因为 病人 一 
般 是 因为 症状 比 别人 更 严重 或 者 还 有 其 他 疾病 才 会 去 医院 ( 而 且 去 医院 的 
流感 病人 可 能 更 容易 死 于 流感 )。 所 以 我 们 看 到 的 并 不 是 流感 导致 的 所 有 
结果 , 而 是 流感 病毒 在 那些 有 其 他 疾病 或 者 流感 症状 十 分 严重 的 病人 身上 
导致 的 结果 。 

为 了 解释 限定 范围 问题 , 我 们 假设 有 两 个 变量 : SAT 总 成 绩 和 学 习 时 
间 。 然 而 ,我 们 并 没有 所 有 SAT 考生 的 成 绩 数据 ， 只 有 那些 数学 和 语文 
成 绩 总 分 超过 1400 分 (图 3-5 中 的 灰色 区 域 ) 的 考生 的 成 绩 数据 。 在 这 
个 假设 的 数据 中 , 成 绩 好 的 考生 包括 那些 天 生 擅 长 考试 的 考生 ( 他 们 不 学 
习 也 能 考 得 好 ) 和 后 天 刻苦 学 习 的 考生 。 如 果 仅 使 用 灰色 区 域 的 考生 的 成 
绩 数据 , 我 们 是 无 法 找到 这 两 个 变量 ( SAT 总 成 绩 和 学 习 时 间 ) 之 间 的 相 
关 性 的 。 但 如 果 我 们 使 用 的 是 所 有 考生 的 考试 成 绩 数据 , 就 会 发 现 这 两 个 
变量 之 间 存 在 很 强 的 相关 性 ( 灰色 区 域 的 考生 的 学 习 时 间 与 考试 成 绩 之 间 
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的 皮尔 逊 相关 系数 为 零 ， 而 在 整个 数据 集中 ， 二 者 的 皮尔 逊 相关 系数 为 
0.85 )。 所 以 说 ， 我 们 可 以 通过 以 某 种 结果 为 限定 条 件 〈 只 研究 出 现 某 种 
结果 的 案例 )， 然 后 从 毫 无 关联 的 变量 之 间 找 到 相关 性 。 如 果 SAT 成 绩 好 
上 课外 活动 丰富 的 学 生 能 够 被 名 校 录取 , 那么 仅 来 自 于 这 些 高 校 的 数据 则 
会 显示 SAT 成 绩 和 很 多 课外 活动 之 间 存 在 某 种 相关 性 ， 因 为 在 这 个 群体 
中 ， 这 两 个 变量 (SAT 成 绩 好 且 参 加 很 多 课外 活动 ) 往往 是 同时 出 现 的 。 
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图 3-5 灰色 区 域 的 数据 代表 的 是 一 个 限定 的 范围 


























这 种 抽样 偏差 十 分 常见 ， 想 想 那些 调查 访客 政治 观点 的 网 站 。 网 站 
的 访客 并 不 是 从 人 群 中 随机 抽取 的 调查 对 象 那些 带 有 极端 政治 偏见 的 网 
站 的 访客 , 其 政治 观点 与 一 般 人 的 政治 观点 之 间 的 偏差 就 更 大 了 。 如 果 某 
个 网 站 的 所 有 访客 都 是 现任 总 统 的 坚定 支持 者 , 那么 该 网 站 的 调查 结果 可 
能 会 显示 , 该 总 统 每 发 表 一 次 重要 演说 ,他 的 支持 率 都 会 上 升 。 但是, 这 
个 结论 所 反映 的 支持 率 和 重要 演说 之 间 的 相关 性 只 存在 于 那些 本 就 喜欢 
这 个 总 统 的 人 身上 ( 因为 接受 这 个 调查 的 正 是 这 群 人 )。 我 们 将 在 第 7 章 
讨论 不 同类 型 的 抽样 偏差 ( 比如 存活 者 偏差 )， 因 为 这 些 偏差 会 影响 我 们 
从 实验 数据 中 得 出 的 结论 。 
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有 一 点 需要 牢记 : 我 们 之 所 以 会 找到 一 些 错误 的 相关 性 ， 除 了 数学 
方面 的 原因 之 外 , 另 一 个 原因 是 人 们 在 观察 数据 时 可 能 会 发 现 一 些 虚假 的 
规律 。 有 些 认 知 偏差 会 让 我 们 在 无 关 的 因素 之 间 推 断 出 联系 , 这 和 抽样 偏 
差 相似 。 比 如 证 实 性 偏差 会 使 人 们 去 寻找 证 据 来 证 实 他 们 的 观点 。 如 果 你 
认为 一 种 药物 会 引起 某 种 副作用 , 那 你 有 可 能 会 去 网 上 搜索 其 他 吃 了 这 个 







































































药 并 且 出 现 了 这 种 副作用 的 病人 。 但 是 


























， 这 种 做 法 意味 着 你 是 在 忽略 所 有 








不 能 证 实 你 的 假设 的 数据 , 而 不 是 寻找 那些 有 可 能 让 你 重新 评估 你 的 观点 
的 证 据 。 证 实 性 偏差 可 能 还 会 导致 你 对 那些 与 你 的 假设 相 矛 盾 的 证 据 产 生 





怀疑 
方法 有 问题 。 





To 




















你 可 能 会 认为 这 些 证 据 的 来 源 不 可 靠 , 或 者 获取 这 些 证 据 的 实验 








人 们 除了 在 寻找 和 使 用 证 据 时 存在 偏差 ， 在 解释 证 据 时 也 可 能 存在 



























































员 差 。 如 果 一 种 新 药 正 在 接受 临床 测试 , 而 一 名 医生 已 经 知道 有 病人 正在 
服用 这 种 药 , 并 且 认 为 这 个 药 对 病人 是 有 帮助 的 , 那么 在 这 种 情况 下 , 他 








就 有 可 能 会 去 寻找 迹象 来 证 明 这 个 药物 是 有 效 的 。 由 于 病人 的 很 多 指标 都 


是 主观 的 ( 比如 运动 强度 和 疲劳 程度 )， 












































这 就 有 可 能 导致 医生 对 这 些 指标 





的 估算 存在 偏差 ， 并 导致 医生 推理 出 一 个 并 不 存在 的 相关 性 。 ”这 个 例子 





来 自 于 一 项 真实 的 研究 , 在 这 项 研究 中 


,发 现 药物 有 效 的 都 是 那些 知情 的 





医生 (我们 将 在 第 7 章 详 细 介 绍 这 项 研究 ， 并 且 介绍 育 测 的 重要 性 )。 
因此 , 先 验 观点 不 同 的 人 可 能 会 对 数据 做 出 不 同 的 解释 , 从 而 得 出 不 同 的 


、 14 
结论 。 























“错觉 相关 ”是 证 实 性 偏差 的 一 种 特殊 形式 , 它 指 的 是 看 到 一 个 实际 




















上 并 不 存在 的 相关 性 。 关节 炎 症状 和 天 气 之 间 可 能 存在 着 一 定 的 联系 , 这 











种 联系 广 为 流 传 以 至 于 人 们 常常 把 它 当 成 事实 。 但 是 , 病人 知道 这 一 联系 
后 就 有 可 能 会 说 这 两 者 之 间 存 在 相关 性 , 但 这 不 过 是 因为 病人 对 这 种 相关 
性 已 经 有 了 心理 上 的 预期 。 然而 ， 当 研究 人 员 综 合 考量 了 病人 自述 、 临 床 








医生 的 评价 和 一 些 客观 的 测量 数据 , 试 








到 客观 地 研究 这 一 相关 性 时 , 却 发 
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现 这 两 者 之 间 并 没有 任何 相关 性 ( 其 他 研究 人 员 已 经 发 现 , 真正 的 罪魁 祸 
首 可 能 是 空气 湿度 ,但 是 这 一 结论 并 不 令 人 信服 )。" 事实 上 ， 当 我 们 把 
那些 关于 病人 自述 的 关节 疼痛 和 气压 之 间 关 系 的 数据 展示 给 一 些 大 学 生 
时 , 他 们 不 仅 在 没有 相关 性 的 时 候 说 看 到 了 相关 性 , 而 且 在 完全 一 样 的 序 
列 中 找到 了 正 相关 性 和 负 相 关 性 。 

这 种 偏差 和 抽样 偏差 很 相似 。 我 们 之 所 以 会 错误 地 认定 某 种 相关 性 ， 
是 因为 我 们 只 关注 了 一 部 分 数据 。 如 果 你 期 望 变量 之 间 存 在 负 相 关 性 , 那 
么 你 就 有 可 能 只 关注 整个 数据 集中 那些 能 够 证 实 这 一 观点 的 一 小 部 分 数 
据 。 这 就 是 它 是 一 种 证 实 性 偏差 的 原因 : 人 们 有 可 能 因为 先 验 的 信念 而 自 
动 将 目光 投向 某 些 数据 。 在 关节 炎 与 天 气 的 案例 中 ， 也许 人 们 对 某 些 证 据 
太 过 重视 (忽视 了 天 气 好 时 关节 疼痛 的 例子 ， 重点 突出 天 气 不 好 时 关节 疼 
痛 的 例子 )， 也 许 人 们 看 到 了 一 些 实际 上 并 不 存在 的 证 据 ( 根据 他 们 所 预 
期 的 联系 和 天 气 的 变化 来 讲述 不 同 的 症状 )。 























































































































3.2 ”相关 性 的 用 途 








假设 我 们 发 现 了 提交 经 费 申请 的 时 间 和 是 否 能 够 得 到 资助 之 间 确 实 
存在 相关 性 。 提 交 申 请 的 时 间 越 时 ,申请 书 的 得 分 就 越 高 , 并 且 两 者 之 间 
的 相关 系数 为 1。 在 这 种 情况 下 , 如果 有 人 提前 一 周 提交 了 申请 , 那 我 们 
就 可 以 准确 预测 出 这 个 人 是 否 能 够 获得 资助 ， 对 吗 ? 

很 多 零售 商都 在 努力 寻找 能 够 预测 人 们 购买 行为 的 指标 ， 他 们 之 所 
以 这 样 做 就 是 依据 上 面 这 种 逻辑 。 有 人 宣称 , 塔 吉 特 公司 在 一 名 青少年 的 
家 人 还 不 知情 的 情况 下 就 已 经 “知道 ”她 怀孕 了 。 这 件 事 让 塔 吉 特 公司 一 
下 上 了 新 闻 头 条 。 “当然 ， 塔 吉 特 公司 并 不 是 真正 知道 那个 女孩 怀孕 了 ， 
而 是 利用 他 们 从 其 他 顾客 身上 收集 到 的 海量 数据 ( 以 及 从 其 他 来 源 购买 到 
的 数据 ) 来 了 解 哪些 因素 与 怀孕 的 各 个 阶段 具有 相关 性 。 比 如 说 , 经 过 足 
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够 的 观察 , 塔 吉 特 公司 发 现 单独 购买 乳液 或 棉 球 并 不 能 说 明 什 么 , 但 是 那 
些 怀 孕 的 女士 通常 会 同时 购买 这 两 样 商品 以 及 一 些 维生素 补充 剂 。 在 有 了 
足够 的 采购 模式 以 及 预产期 ( 可 以 从 婴儿 登记 处 获得 或 者 根据 顾客 购买 早 
孕 测试 纸 的 日 期 估算 出 来 ) 数据 后 ， 塔 吉 特 公司 就 能 判断 出 一 名 顾客 怀 
孕 的 可 能 性 有 多 大 ， 并 且 能 够 估算 出 她 已 经 怀孕 多 久 了 。 此 外 ， 即 便 我 
们 只 知道 有 人 连续 购买 了 两 盒 早 孕 试 纸 ， 也 能 从 中 得 知 第 一 张 早孕 试纸 
测试 结果 有 可 能 是 阳性 的 。 

Amazon, Netflix 和 LinkedIn 这 类 网 站 就 是 利用 相关 性 来 为 用 户 推荐 
各 种 互补 性 商品 、 用 户 可 能 会 喜欢 的 电影 和 可 能 会 用 到 的 链接 。 比 如 
Netflix 网 站 能 够 找到 那些 和 你 一 样 喜欢 某 类 电影 的 人 , 然后 向 你 推荐 一 些 
在 这 些 人 中 评价 很 高 而 你 还 没有 看 过 的 电影 。 也 正 是 这 一 点 让 研究 人 员 在 
没有 用 户 身 份 信息 的 Netflix 数据 集中 ,能够 利用 来 自 男 一 渠道 ( 比如 
IMDB ) 的 数据 再 次 识别 用 户 的 身份 “。 我 们 介绍 的 只 不 过 是 一 个 基本 的 
构想 , 真正 的 算法 比 这 要 复杂 得 多 。 这 些 网 络 公司 不 一 定 关心 究竟 是 什么 
原因 让 你 去 做 了 某 件 事 ， 毕 竟 Netflix 网 站 能 够 为 你 推荐 足够 多 你 喜欢 的 

影 ， 而 不 用 知道 你 在 辛苦 工作 了 一 天 之 后 只 想 看 看 情景 喜剧 。 

然而 ， 很 多 基于 相关 性 做 的 预测 都 以 失败 告终 ， 无 论 这 些 相关 性 是 
否 存 在 对 应 的 因果 关系 。 使 用 相关 性 的 风险 之 一 在 于 , 对 于 两 个 变量 之 间 
的 任何 相关 性 , 我 们 都 可 能 会 找到 一 些 理由 来 解释 这 种 相关 性 是 如 何 产生 
的 ,从 而 导致 人 们 对 结果 过 分 自信 。 一 个 关于 数据 挖掘 的 著名 案例 是 , 有 
人 利用 杂货 店 的 交易 数据 发 现 了 人 们 经 常 同 时 购买 尿布 和 啤酒 这 一 现象 。 
于 是 就 有 人 认为 , 经 常 在 周末 来 临 之 前 去 商店 买 尿布 的 男士 , 会 顺便 买 一 
些 啤酒 来 “奖励 ”自己 。 但 是 当 追 踪 到 这 个 故事 的 根源 之 后 , Daniel Power 
( 2002 ) 发 现 最 初 的 相关 性 数据 并 没有 提 到 性 别 以 及 时 间 因 素 ， 更 没有 像 
有 些 人 说 的 那样 一 一 杂货 店 特意 将 这 两 样 商 品 放 得 很 近 , 以 便 一 起 销售 来 
增加 收益 。 人 们 在 杂货 店 同时 购买 的 商品 也 可 能 只 是 爆 米 花 和 和 餐巾 纸 
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(晚上 要 看 悲伤 的 电 





























BD), 或 者 鸡蛋 和 治疗 头疼 的 药物 ( 宿 醉 )。 





假设 Amazon 网 站 发 现 ， 购 买 某 个 校园 剧 和 购买 AP 考试 ( 美国 大 学 




















预 修 课程 考试 ) 复习 用 书 这 两 个 行为 高 度 相关 。 很 明显 , 美国 青少年 是 这 
两 种 购买 行为 的 主体 。 如果 Amazon 网 站 只 想 向 同一 购买 数据 群体 推荐 这 
些 商 品 ,那么 他 们 不 知道 这 两 种 购买 行为 的 主体 也 没关系 。 但 如 果 Amazon 
网 站 开始 把 AP 复习 用 书 推 荐 给 其 他 国家 的 顾客 ， 那 应 该 没 多 少 人 会 买 ， 

因为 这 些 考 试 的 参与 者 主要 是 美国 学 生 。 所 以 , 即便 某 种 相关 性 既 真实 存 










































































在 又 十 分 可 靠 , 如 时 














我 们 试图 将 它 用 在 另 一 个 不 具备 让 这 一 相关 性 起 作用 


























的 特征 (我 们 将 在 第 9 章 介 绍 这 样 的 特征 ) 群体 中 ,那么 它 可 能 不 会 起 
到 任何 预测 作用 。 这 个 相关 性 并 没有 告诉 我 们 为 什么 这 些 事物 之 间 存 在 
联系 一 一 购买 者 都 是 十 六 七 岁 、 正 在 准备 AP 考试 、 喜 欢 看 主人 公 年 龄 和 






































他 们 相仿 的 ! 





电视剧 


所 以 我 们 很 难 用 它 来 预测 其 他 情况 。 





这 个 例子 还 是 相当 明确 的 ， 但 还 有 一 些 作用 机 制 很 模糊 的 例子 也 流 


传 了 下 来 。1978 年 





， 一 名 体育 新 闻 记者 开玩笑 似 地 提出 了 一 个 股市 新 指 














标 : 如果 美国 足 联 的 某 个 球 队 赢得 了 超级 碗 比赛 ,那么 年 底 股市 就 会 下 跌 ， 
否则 股市 就 会 上 涨 。 “没有 任何 理由 能 使 这 两 件 事 联系 在 一 起 ， 但 是 考虑 
到 人 们 可 能 用 在 股市 上 的 各 种 指标 〈 而 且 很 多 时 候 看 起 来 都 是 对 的 )， 这 
就 足以 说 服 一 个 没有 批判 性 思维 的 人 去 相信 这 个 说 法 。 但 是 ， 不 了 解 这 
一 规律 的 作用 机 制 是 什么 ， 就 无 法 预测 这 个 规律 什么 时 候 会 被 打破 。 

这 个 规律 之 所 以 会 起 作用 ， 可 能 是 由 于 人 们 对 这 种 所 谓 的 相关 性 的 
认识 影响 了 人 们 的 行为 , 因为 它 已 经 众所周知 了 。 这 也 是 我 们 在 使 用 网 络 
搜索 或 社交 媒体 上 的 帖子 等 观察 数据 来 寻找 事物 的 趋势 时 ,需要 关注 的 一 





个 问题 。 当 用 













































































户 知 道 有 人 在 做 这 些 观 察 时 , 他 们 可 能 会 恶意 地 与 系统 进行 





博弈 ， 还 可 能 会 改变 他 们 自身 的 行为 《也 可 能 是 因为 媒体 的 报道 )。 
所 以 ， 尽 管 我 们 可 以 用 相关 性 来 做 一 些 预 测 ， 但 这 些 预测 有 可 能 会 











失败 ， 而 且 我 们 测量 出 来 的 相关 性 也 可 能 是 错误 的 。 








3.3 ”为 什么 相关 性 不 是 因果 关系 
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有 一 次 我 举办 了 一 个 关于 因果 推理 的 讲座 , 讲座 结束 后 , 一 个 学 生 问 


这 个 问题 的 答案 既是 


= 








“ 休 议 不 是 说 过 因果 关系 实际 上 就 是 相关 性 吗 ?” 

















肯定 的 也 是 否定 的 。 因 果 关 系 本 身 可 能 更 能 决定 它 是 不 是 相关 性 , 但 我 们 
却 无 法 确定 这 一 点 ， 只 是 我 们 能 够 观察 到 的 因果 关系 基本 上 都 是 相关 性 
(特殊 类 型 的 规律 )。 然 而 ， 这 并 不 意味 着 因果 关系 本 身 就 是 相关 性 一 一 

只 不 过 相关 性 正好 是 我 们 观察 到 的 关系 。 这 也 意味 着 寻找 和 分 析 因 果 关 系 

















的 绝 大 部 分 工作 就 是 , 找 一 些 方法 来 将 具有 因果 关系 的 相关 伯 


果 关 系 的 相关 性 区 分 开 来 。 


























E 和 不 具有 因 


我 们 可 能 会 通过 实验 ， 也 可 能 会 通过 统计 学 方法 来 完成 这 个 工作 ， 
但 关键 是 不 能 在 找到 相关 性 之 后 就 停 下 来 。 尽 管 本 书 讨论 了 很 多 关于 




























































































Ds 


E 之 后 的 章节 中 详细 阐述 其 他 的 情形 。 























“表面 上 的 因果 关系 可 能 并 不 是 实际 上 的 因果 关系 ”的 情形 ,但 是 在 这 一 
节 , 我 们 将 简单 了 解 一 些 在 没有 对 应 的 因果 关系 时 出 现 相关 性 的 情形 , 并 





第 一 个 需要 注意 的 问题 是 : 相关 性 系数 是 对 称 的 。 身 高 和 年 龄 之 间 

















的 相关 性 与 年 龄 和 身高 之 间 的 相关 性 完全 一 样 。 但是, 因果 关系 可 能 是 不 
对 称 的 。 咖 啡 让 人 失眠 并 不 意味 着 失眠 一 定 会 让 人 喝 咖 啡 ( 不 过 这 种 情况 





























也 有 可 能 发 生 : 当 人 们 睡眠 不 足 时 ， 可 能 会 在 早上 喝 很 多 咖啡 )， 同 样 ， 














将 反映 原因 显著 性 的 任何 数值 ( 比如 条 件 概率 ) 正 着 算 和 反 着 算 也 是 不 一 

















样 的 。 当 发 现 一 个 相关 性 时 ,如 果 我 们 完全 不 知道 组 成 这 一 相关 性 的 因素 


的 发 生 顺 序 , 那么 每 一 个 因素 都 可 能 是 导致 男 一 个 因素 出 现 的 原因 ( 也 有 





可 能 存在 一 个 反馈 循环 )， 而 单 赁 测量 相关 性 并 不 能 区 














种 ) 可 能 性 。 如 果 我 们 试图 用 因果 故事 去 解释 一 对 相 











们 的 背景 知识 来 推测 哪 一 个 因素 引起 另 一 个 因素 的 可 能 


























区 分 出 这 两 种 (或 三 
关 因 素 ， 
性 最 大 。 即便 性 别 








就 会 利用 我 








与 中 风 的 概率 之 间 存在 相关 性 , 也 不 可 能 出 现 中 风 决 定性 别 的 事 。 如 果 我 
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们 发 现 体重 增加 和 和 久 坐 不 动 的 行为 之 间 存 在 相关 性 , 这 两 个 因素 之 间 的 相 
关 程 度 也 并 不 能 告诉 我 们 这 一 关系 的 指向 性 可 能 会 是 什么 ( 这 两 个 因素 哪 
一 个 可 能 会 是 原因 ， 哪 一 个 可 能 会 是 结果 )。 

弄 错 相关 性 的 原因 有 很 多 。 在 XMRYV 病毒 和 慢性 疲劳 综合 征 那 个 案 
例 中 ， 弄 错 相关 性 的 原因 是 实验 中 使 用 的 样本 被 污染 了 。 在 其 他 案例 中 ， 
有 可 能 是 计算 机 程序 中 的 病毒 导致 的 ， 也 可 能 是 眷 写 结论 时 的 失误 导致 
的 , 还 可 能 是 错误 的 数据 分 析 方 法 导致 的 。 表面 上 的 联系 可 能 是 统计 工具 
导致 的 , 也 可 能 只 是 一 种 巧合 , 就 像 股 市 和 足球 比赛 那个 例子 一 样 。 然 而 ， 
还 有 可 能 是 偏差 导致 的 。 既 然 我 们 能 够 从 一 个 有 偏差 的 样本 中 找到 一 个 并 
不 存在 的 相关 性 , 那么 同样 的 问题 也 能 导致 我 们 找到 一 个 没有 因果 关系 的 
相关 性 。 

尽管 因果 关系 能 够 解释 一 些 相 关 性 问题 ， 但 是 仍然 要 牢记 这 一 点 : 
因果 关系 并 不 是 相关 性 的 唯一 解释 。 比如 我 们 发 现 按 时 上 班 和 享用 丰盛 的 
早餐 之 间 存 在 相关 性 , 但 是 也 许 这 两 者 都 是 早起 的 结果 ( 早起 让 我 们 有 时 
间 吃 早饭 ， 而 不 是 立刻 就 冲 向 办 公 室 )。 当 我 们 在 两 个 变量 之 间 发 现 一 种 
相关 性 时 ,必须 考察 一 下 这 种 无 法 测定 的 因素 (一 个 共同 的 原因 ) 能 否 解 
释 变量 之 间 的 联系 。 

在 第 4 章 的 一 些 案例 中 , 这 个 共同 因素 就 是 时 间 , 我 们 将 会 知道 为 什 
么 我 们 会 在 那些 随 着 时 间 的 变化 而 呈现 出 一 定 趋势 的 因素 之 间 发 现 很 多 
错误 的 相关 性 。 如 果 互 联网 用 户 的 数量 一 直 在 上 升 , 国债 的 购买 数量 也 一 
直 在 上 升 , 那么 这 两 者 之 间 就 会 出 现 相 关 性 。 但 一 般 情 况 下 , 我 们 指 的 因 
素 是 能 够 解释 相关 性 的 一 个 变量 或 者 一 系列 变量 。 我 们 可 能 想 知 道学 习 是 
否 能 提高 我 们 的 成 绩 , 或 者 那些 较 好 的 学 生 是 否 更 有 可 能 既 爱 学 习 成 绩 
好 。 也 有 可 能 天 生 的 能 力 是 学 习 时 间 和 成 绩 的 共同 原因 。 如 果 我 们 能 够 改 
变 这 种 能 力 , 那 它 可 能 对 成 绩 和 学 习 时 间 都 会 产生 影响 ,然而 , 任何 关于 
成 绩 和 学 习 的 实验 研究 都 不 会 对 另外 两 个 因素 产生 影响 。 
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与 时 间 因 素 相 似 ， 相 关 变 量 之 间 不 存在 直接 因果 关系 的 另 一 个 原因 








是 中 间 变 量 。 比 如 说 , 住 在 城 里 和 较 低 的 体重 指数 之 间 存 在 相关 性 ， 因 为 
城市 居民 走路 比 开 车 多 ， 所 以 活动 频率 更 高 一 些 。 所 以 ， 住 在 城 里 就 间接 
导致 了 较 低 的 体重 指数 。 但 如 果 搬 到 城 里 居住 却 又 开车 出 行 ， 那 这 就 是 一 
个 无 效 的 减肥 策略 。 大 部 分 情况 下 我 们 找到 的 都 是 间接 原因 《〈 比如 我 们 找 
到 的 是 吸烟 引起 肺癌 这 一 结果 ,而 不 是 具体 的 生物 进程 ), 但 是 了 解 原因 具 
体 起 作用 的 机 制 (原因 如 何 导 致 结果 ) 能 够 让 我 们 找到 更 好 的 干预 措施 。 

综合 数据 显示 的 结果 可 能 会 很 奇怪 。2012 年 《新 英格兰 医学 杂志 》 发 















































表 的 一 篇 文章 说 , 人 均 消 费 巧克力 的 数量 和 每 千 万 人 中 有 人 获得 诺 贝 尔 奖 
的 人 数 之 间 存 在 显著 的 相关 性 ，” 并 且 相关 系数 高 达 0.791。 在 排除 掉 瑞 
典 之 后 ， 这 个 相关 系数 提高 到 了 0.862。 之 所 以 将 瑞典 排除 在 外 ， 是 因为 
这 个 国家 的 数据 是 异常 值 , 它 所 产生 的 诺 贝尔 奖 获得 者 的 数量 比 人 均 消 费 
巧克力 的 数量 多 得 多 。 要 特别 注意 的 是 ,消费 巧克力 的 数据 和 获奖 数据 的 
来 源 是 不 同 的 , 这 些 数据 源 分 别 以 每 个 国家 为 整体 , 然后 分 别 进行 数据 的 







































































测算 。 这 就 意味 着 我 们 并 不 知道 吃 巧克力 的 人 和 赢得 诺 贝尔 奖 的 人 是 不 是 























同一 群 人 。 而 且 获 奖 人 数 只 是 人 口 总 数 中 极 小 的 一 部 分 , 所 以 获奖 人 数 只 
要 增加 几 个 就 能 导致 相关 系数 值 发 生 巨大 的 变化 。 大 多 数 研究 报告 都 将 关 




















注 点 放 在 了 “ 吃 巧克力 和 获得 诺 贝 尔 奖 之 间 可 能 存在 的 因果 关系 ”上 : 以 








“巧克力 会 让 人 更 加 聪明 吗 ? ”2”“ 获 得 诺 贝尔 奖 的 秘诀 ?多 上 


多 巧克力 。” 


这 种 标题 命名 的 报告 比比 丝 是 。 但 这 项 研究 并 不 能 证 明 这 些 标题 中 的 观 














点 ， 那 些 有 很 多 诺 贝 尔 奖 得 主 的 国家 也 可 以 用 很 多 巧克力 来 庆祝 OE, 











相关 系数 是 对 称 的 )。、 此 外 ， 我 们 无 法 断言 多 吃 巧克力 是 否 可 以 增加 获奖 
的 机 会 , 或 者 各 国 是 否 应 该 鼓励 公民 多 吃 巧克力 , 又 或 者 吃 : 














某 个 因素 的 指标 ,比如 该 国 的 经 济 状况 。 如 果 还 需要 进一步 











号 克 力 是 否 是 








的 理由 


才能 让 


你 怀疑 这 一 相关 性 的 准确 性 , 不 妨 想 想 那 些 研究 人 员 。 他 们 在 没有 进行 深 




















入 分 析 的 情况 下 就 将 相关 性 看 成 因果 关系 , 甚至 通过 统计 数据 发 现 各 个 国 
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FENG (一 种 鸟 类 ) 的 数量 和 人 口 出 生 率 之 间 也 存在 显著 的 相关 性 ,这 充 
分 说 明了 他 们 的 行为 有 多 么 思春 。” 
尽管 关于 巧克力 的 这 项 研究 有 点 滑稽 ， 但 是 这 种 类 型 的 综合 数据 经 
常 被 用 来 在 某 个 群体 中 建立 某 种 相关 性 , 而 且 由 于 上 述 原因 , 这 种 数据 不 
易 使 用 又 很 难 解释 。 将 数据 与 时 间 联 系 在 一 起 可 能 会 有 所 帮助 〈 比如 在 颁 
奖 之 前 巧克力 的 消费 数量 上 升 了 吗 ) 也 有 可 能 是 多 起 事件 共同 导致 了 这 
变化 ( 比如 巧克力 的 消费 数量 突然 增加 ， 教 育 政策 也 发 生 了 变化 )， 并 且 
获奖 者 通常 是 在 取得 能 让 其 获奖 的 成 就 之 后 很 久 才 会 获得 诺 贝尔 奖 。 可 能 
还 有 很 多 其 他 因素 也 呈现 出 了 相似 的 相关 性 , 但 就 在 这 个 巧克力 案例 之 后 ， 
又 有 一 个 很 滑稽 的 “追踪 研究 ”暗示 诺 贝 尔 奖 和 牛奶 之 间 存在 相关 性 。” 






















































































3.4 ”多 重 测试 与 P 值 








我 们 让 一 位 参与 者 进入 功能 性 磁 共 振 成 像 扫描 仪 ， 然 后 给 这 位 参与 
者 看 各 种 社会 场景 的 图 片 , 并 让 其 判断 每 一 张 图 片 中 人 的 情感 状态 。 通 过 
功能 性 磁 共振 成 像 扫 描 仪 , 研究 人 员 能 够 测量 参与 者 大 脑 中 各 个 区 域 的 血 
液 流量 , 并 且 经 常会 用 这 一 测量 结果 作为 神经 活动 指标 “， 以 此 来 判断 不 
同 种 类 的 任务 会 用 到 大 脑 中 的 哪些 区 域 。 最 后 扫描 出 来 的 彩色 图 像 可 以 向 
我 们 展示 大 脑 中 哪些 区 域 的 血液 流量 明显 增加 了 , 这 就 是 一 些 研究 论文 中 谈 
到 的 大 脑 中 有 些 区 域 在 特定 的 刺激 下 “ 亮 了 起 来 ”的 含义 。 找 到 大 脑 中 那些 
被 激活 的 区 域 ， 可 以 让 我 们 深入 了 解 大 脑 的 各 个 部 分 是 如 何 连 接 在 一 起 的 。 
在 这 项 研究 中 ， 我 们 发 现 参与 者 大 脑 中 好 几 个 区 域 的 血液 流量 都 发 
生 了 十 分 显著 的 变化 ( 从 统计 学 上 来 讲 )。 事实 上 ，0.05 常常 被 用 作 P 值 
测量 中 的 临界 值 CP 值 越 小 证 明显 著 性 越 高 )， 而 大 脑 中 某 个 区 域 的 活 牙 
度 的 P 值 只 有 0.01。 那么 , 这 个 区 域 是 否 和 人 们 想象 他 人 情感 ( 换 位 思 
考 ) 的 活动 有 关 呢 ? 
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如 果 这 项 研究 的 参与 者 是 一 条 死 掉 的 三 文公， 上 述 结果 发 生 的 可 能 
性 似乎 不 大 。 一 条 死 鱼 怎么 能 对 视觉 刺激 做 出 反应 呢 ? 上 述 结论 无 论 使 用 
什么 样 的 常规 临界 值 , 报告 中 的 显著 性 都 会 非常 高 。 所 以 ,问题 不 在 于 这 

显著 性 是 否 被 夸大 了 , 而 在 于 它 是 如 何 出 现 的 。 为 此 , 我 们 需要 简单 地 
插入 一 些 统计 学 知识 。 

研究 人 员 常 常 需 要 确定 某 种 效果 是 否 具有 显著 性 〈 某 种 相关 性 是 真 
实 存在 的 还 是 统计 假象 )， 或 者 两 个 群体 之 间 是 否 有 差异 ( 人们 在 看 人 和 
看 动物 时 ， 大 脑 的 活跃 区 域 相同 吗 )， 但 他 们 需要 一 些 定量 的 指标 来 客观 
地 确定 哪些 发 现 是 有 意义 的 。P 值 就 是 一 个 用 来 测量 显著 性 的 常用 指标 ， 
人 们 用 它 来 对 比 两 个 不 同 的 假设 ( 零 假 设 和 对 立 假设 )。 

P 值 告诉 我 们 , 如 果 零 假设 成 立 , 那 我 们 看 到 一 个 至 少 和 已 经 观察 到 
的 结果 一 样 极端 的 例子 的 概率 有 和 多大。 

对 于 我 们 而 言 ， 这 些 假设 可 能 是 指 两 个 事物 之 间 没 有 因果 关系 F 
假设 ) 或 者 有 因果 关系 (对立 假设 )。 或 者 是 男 一 种 情况 ， 零 假设 可 能 认 
为 硬币 是 均匀 的 ,而 对 立 假设 则 认为 硬币 是 不 均匀 的 。 人 们 常常 把 P 值 误 
解 为 零 假设 成 真 的 概率 。 尽 管 人 们 一 般 把 0.05 作为 临界 值 ， 但 是 并 没有 任 
何 定律 规定 P 值 在 0.05 以 下 的 结果 就 一 定 是 显著 的 ， 而 0.05 以 上 的 就 一 
定 是 不 显著 的 。 这 只 是 一 种 惯例 ， 而 且 选 择 0.05 作为 临界 值 也 极 少 会 遭 
到 其 他 研究 人 员 的 反对 。”“ 这 些 数值 并 不 一 定 能 完全 反映 实际 的 显著 性 ， 
因为 显著 性 极 小 的 结果 可 能 会 有 极 小 的 P 值 , 而 显著 性 极 大 的 结果 都 可 能 
达 不 到 统计 学 对 显著 性 P 值 的 要 求 。 

在 电影 《 罗 森 ' 格 兰 效 与 吉尔 ' 登 斯 顿 之 死 》 的 开头 ， 有 几 个 人 在 
掷 一 枚 刚刚 捡 到 的 硬币 , 他们 越 掷 越 奇怪 ,因为 这 个 硬币 每 次 都 是 正面 朝 
上 , 一 连 157 次 都 是 如 此 。” 一 枚 硬币 连续 157 次 正面 朝 上 的 概率 极 小 
(准确 地 说 只 有 1/2 ”)， 而 与 之 同样 极端 的 情况 就 是 连 掷 157 次 都 反面 朝 
Es MA, BR ' 格 兰 效 与 吉尔 登 斯 顿 观察 到 的 确实 是 一 个 P 值 极 低 的 
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事件 。 但 这 并 不 意味 着 一 定 有 什么 奇怪 的 东西 在 作 上 水， 只 不 过 这 一 结果 在 
硬币 均匀 的 情况 下 不 大 可 能 出 现 而 已 。 

再 看 一 个 没 那么 极端 的 情况 ， 比 如 我 们 连 抛 了 10 次 硬币 ， 其 中 9 次 
是 正面 朝 上 ，1 次 是 反面 朝 上 。 这 个 结果 〈 和 零 假设 为 硬币 是 均匀 的 ， 对 立 
假设 为 硬币 正面 朝 上 或 反面 朝 上 都 是 不 均匀 的 ) 的 P 值 是 9 次 正面 朝 上 和 
1 次 反面 朝 上 的 概率 , 加 上 9 次 反面 朝 上 和 1 次 正面 朝 上 的 概率 , 加 上 10 
次 正面 朝 上 的 概率 , 加 上 10 次 反面 朝 上 的 概率 。” 之 所 以 要 加 上 全 部 正面 
朝 上 的 概率 和 全 部 反面 朝 上 的 概率 ， 是 因为 我 们 计算 的 是 至 少 与 我 们 观察 
的 事件 同样 极端 的 事件 的 概率 ， 而 全 部 正面 朝 上 和 全 部 反面 朝 上 这 两 个 事 
件 比 9 次 正面 朝 上 和 1 次 反面 朝 上 这 样 的 事件 更 为 极端 。 这 个 案例 的 对 立 
假设 为 这 个 硬币 是 不 均匀 的 , 既 不 是 仅仅 偏向 正面 , 也 不 是 仅仅 偏向 反面 ， 
这 就 是 我 们 要 把 连续 出 现 反面 朝 上 的 案例 也 包括 进去 的 原因 。 图 3-6 的 柱 
形 图 展示 的 是 10 枚 硬币 每 个 搓 10 次 ， 其 中 正面 朝 上 的 次 数 。 如 果 每 一 枚 
硬币 抛 出 的 结果 都 恰好 是 5 个 正面 和 5 个 反面 , 那么 在 这 些 横 轴 为 10 的 柱 
形 图 中 , 每 个 图 形 的 竖 形 柱 都 会 集中 在 5 这 个 中 心 点 上 。 但 在 实际 生活 中 ， 
硬币 抛 出 的 结果 既 会 出 现 数值 大 于 5 的 情况 ,也 会 出 现 数值 小 于 5 的 情况 ， 
甚至 还 出 现 了 一 种 全 部 反面 朝 上 的 情况 ( 由 图 中 最 左边 的 小 竖 形 柱 来 表示 )。 

即使 我 们 用 的 是 一 枚 均匀 的 硬币 ， 上 面 这 个 事件 出 现 的 概率 依然 很 
小 ， 但 如 果 我 们 抛 100 枚 均匀 的 硬币 又 会 出 现 什 么 结果 ?实验 的 次 数 多 
了 ,我 们 就 有 更 多 的 机 会 碰巧 看 到 一 些 似 乎 很 反常 的 事情 。 比 如 说 ,每 个 
人 买 彩票 中 奖 的 概率 都 非常 低 , 但 如 果 买 彩票 的 人 足够 多 , 那 我 们 几乎 可 
以 保证 总 会 有 人 中 奖 。 图 3-7 所 示 的 柱 形 图 和 前 面 的 柱 形 图 一 样 ,但 这 一 
次 用 的 硬币 是 100 枚 而 不 是 10 枚 。 在 这 种 情况 下 ， 如 果 没 有 看 到 任何 一 
枚 硬币 抛 出 了 9 个 或 10 个 正面 或 反面 ， 那 我 们 会 感到 更 加 惊讶 ( 同样， 
如 果 彩 票 的 中 奖 率 为 千 万 分 之 一 , 但 是 有 1 亿 人 买 了 彩票 却 没有 一 个 人 中 
奖 ， 这 也 会 让 人 感到 惊讶 )。 
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0 5 10 0 5 10 
正面 朝 上 的 次 数 正面 朝 上 的 次 数 

图 3-6 一 个 柱 形 图 表示 一 次 实验 的 结果 ， 每 次 实验 都 是 10 枚 硬币 
各 枚 掷 10 次。 根据 硬币 正面 朝 上 的 次 数 , BERS 10 次 就 能 获 
得 图 形 上 一 个 数据 点 。 图 中 展示 的 是 8 次 实验 的 结果 





0 5 10 0 5 10 
正面 朝 上 的 数量 正面 朝 上 的 数量 


图 3-7 100 枚 硬币 每 枚 掷 10 次 的 结果 。 图 中 展示 的 是 4 次 实验 的 结果 
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一 次 进行 多 个 测试 是 会 出 现 问题 的 ， 这 一 问题 正 是 我 们 一 开始 介绍 
的 功能 性 磁 共 振 成 像 研究 中 出 现 的 问题 。 在 磁 共 振 成 像 研究 中 ,人 们 考察 
了 大 脑 中 好 几 千 个 很 小 的 区 域 〈 在 研究 人 脑 时 所 考察 的 小 区 域 数 量 更 多 ， 
因为 人 的 大 脑 要 大 得 多 )， 所 以 其 中 有 一 个 区 域 呈现 出 明显 的 血液 流动 现 
象 也 并 不 奇怪 。 这 种 问题 被 称 为 多 重 假设 检验 ,顾名思义 ， 它 指 的 是 同时 
检验 大 量 假设 。 随 着 能 够 产生 海量 数据 集 的 新 方法 ( 比如 功能 性 磁 共振 成 
像 技术 和 基因 表达 阵列 ) 以 及 “大 数据 ”的 出 现 , 多 重 假设 检验 的 难度 越 
来 越 大 。 以 前 我 们 可 能 只 能 用 一 个 实验 检验 一 种 假设 , 但 现在 我 们 能 够 分 
析 上 千 个 变量 。 由 于 检验 的 数量 庞大 , 所 以 即使 发 现 有 些 变量 之 间 存 在 一 
些 相关 性 也 并 不 应 该 感到 奇怪 。 
在 那个 以 三 文 鱼 为 参与 者 的 研究 中 ， 研 究 人 员 检 验 了 数 千 个 假设 ， 
每 个 假设 都 认为 大 脑 中 的 某 个 区 域 会 在 实验 任务 中 表现 出 显著 的 活跃 性 。 
这 项 研究 的 目的 实际 上 就 是 告诉 人 们 , 这 些 测试 可 能 会 单纯 因为 巧合 而 出 
现 一 些 似乎 具有 显著 相关 性 的 结果 。 这 一 研究 还 介绍 了 一 些 纠正 多 重 对 比 
问题 的 统计 方法 ( 基本 上 每 一 次 测试 都 需要 使 用 更 为 严格 的 临界 值 ) 使 
用 了 这 些 统计 方法 后 ,即便 我 们 放松 对 P 值 的 要 求 , 也 不 会 再 出 现 显 著 的 
活跃 性 。” 

要 牢记 一 点 : 在 阅读 关于 显著 性 发 现 的 报告 时 ， 如 果 这 个 发 现 是 从 
大 量 同 时 进行 的 测试 中 计算 出 来 的 , 那么 就 有 必要 看 看 这 些 报告 的 作者 们 
是 如 何 处 理 多 重 对 比 问题 的 。 至 于 究竟 该 如 何 ( 以 及 何 时 ) 纠 正 这 个 问题 ， 
统计 学 家 们 意见 不 一 , 但 从 总 体 上 来 说 , 这 些 分 歧 归 根 结 底 是 要 确定 哪 
种 错误 的 影响 更 大 。 在 纠正 多 重 对 比 的 过 程 中 , 我 们 其 实 是 选择 了 减少 错 
误 的 发 现 ， 即 使 因此 错过 了 一 些 重要 的 发 现 ( 导致 漏 报 ) 也 没关系 。 而 
如 果 我 们 认为 不 应 该 纠正 多 重 对 比 问题 ， 则 是 选择 了 宁愿 找到 一 些 错误 的 
发 现 ， 也 不 愿 错过 一 些 真 正 正确 的 发 现 。 

这 两 种 错误 一 直 是 一 个 此 消 彼 长 的 问题 ， 究 况 哪 一 个 更 合适 则 完全 
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取决 于 人 们 各 自 的 目的 。”" 对 于 那些 探索 性 分 析 来 说 ， 分 析 结 果 会 继续 接 























受 实 验 的 验证 。 在 这 种 情况 下 , 我 们 可 能 想 让 分 析 结 果 包 括 的 范围 更 广 一 
些 。 相反 ,如 果 我 们 正 试图 为 一 个 昂贵 的 药品 开发 项 目 挑选 一 个 针对 性 很 
强 的 参与 者 群体 , 那么 每 一 个 错误 的 推理 都 可 能 导致 我 们 浪费 大 量 的 金钱 


和 努力 。 

















3.5 没有 相关 性 的 因果 关系 





尽管 我 们 常常 讨论 为 什么 某 个 相关 性 不 是 因果 关系 这 一 问题 ， 但 我 
们 也 必须 承认 ,有 些 因 果 关 系 中 确实 没有 明显 的 相关 性 。 这 意味 着 仅 靠 相 
关 性 并 不 足以 证 明 因果 关系 的 存在 , 而 且 相 关 性 也 并 不 是 因果 关系 的 必要 
条 件 。 辛 普 森 悖 论 就 是 个 例子 〈 我 们 将 在 第 5 章 详细 讨论 这 个 案例 )。 即 





















































使 两 个 事物 在 一 些小 群体 中 存在 某 种 联系 ( 比如 说 与 某 个 人 群 当前 使 用 的 











治疗 方案 相 比 ， 某 种 试验 药 能 够 改善 治疗 效果 )， 但 当 我 们 将 这 些小 群体 
合 在 一 起 时 ,可 能 就 会 发 现 二 者 之 间 不 存在 任何 关系 , 或 者 存在 完全 相反 





的 关系 。 如果 某 种 新 药 的 使 用 者 往往 是 那些 病 得 很 重 的 病人 , 而 病 得 不 重 









































的 病人 往往 会 使 用 当前 的 治疗 方法 ， 那么 在 不 考虑 病情 严重 程度 的 情况 



































下 ， 试 验 药 在 整个 病人 群体 中 导致 的 结果 似乎 要 更 严重 一 些 。 














再 举 一 个 没有 相关 性 的 因果 关系 : 长 跑 对 体重 的 影响 。 虽 然 长 跑 能 





够 消耗 热量 从 而 减轻 体重 , 但 是 长 跑 也 能 导致 食欲 大 增 从 而 增加 体重 ( 而 














这 又 会 对 减肥 造成 负面 影响 )。 根 据 每 种 影响 的 强度 不 同 ,或 者 根据 调查 
的 数据 不 同 , 跑步 的 积极 作用 可 能 恰好 会 被 它 的 消极 作用 抵消 , 结果 人 们 
就 会 发 现在 跑步 和 减肥 之 间 不 存在 任何 相关 性 。 这 个 例子 的 因果 结构 如 
图 3-8 所 示 。 还 有 一 个 关于 吸烟 的 例子 : 有 些 吸烟 者 会 加 强 锻 炼 并 改善 饮 


R, 以 此 来 抵消 吸烟 



























































对 他 们 健康 的 负面 影响 , 最 后 导致 人 们 无 法 找到 吸烟 














在 某 些 方面 对 他 们 的 影响 。 在 这 两 个 案例 中 ， 同 一 个 原因 通过 不 同 的 路 
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aN] 


径 既 对 人 们 产生 了 积极 的 影响 , 也 带 来 了 消极 的 影响 。 这 就 是 为 什么 我 们 
可 能 观察 不 到 任何 相关 性 , 或 者 只 能 观察 到 极 弱 的 相关 性 GEE, 测量 本 

















身 并 不 是 完美 的 )。 











跑步 


体重 减轻 


图 3-8 积极 的 因果 关系 ( 向 上 的 箭头 ) 与 消极 的 因果 关系 ( 向 下 的 
箭头 ) 根据 人 群 的 情况 ， 这 些 影响 可 能 会 相互 抵消 








我 们 已 经 研究 了 一 些 可 能 会 导致 我 们 无 法 发 现 某 个 相关 性 的 其 他 原 


( 比如 抽样 偏差 、 变 化 量 不 足 、 




















果 关 系 并 不 总 意味 着 相关 性 。” 





注释 


1. Lombardi 等 (2009 )。 
2.， 这样 的 研究 和 理论 有 很 多 ，Afari 




















证 实 性 偏差 、 非 线性 相关 ， 等 等 )， 而 


且 也 经 常 听 说 相关 性 并 不 意味 着 因果 关系 。 但 这 句 话 倒 过 来 也 很 重要 : 


和 Buchwald ( 2003 ) 写 了 一 篇 评论 文章 ， 


讨论 了 其 中 的 一 些 研 究 成 果 和 理论 。 








3. Holgate 等 人 (2011 ) 的 研究 简短 地 介绍 了 人 们 在 研究 CFS 的 过 程 中 遇 到 
的 各 种 困难 ， 包 括 各 种 定义 上 的 差异 。 
4， 有 些 研 究 未 能 成 功 复制 CFS/XMRV 联系 ， 其 中 包括 Erlwein 等 (2010) 和 
vanKuppeveld 等 (2010 ) 的 研究。 





5. Lo 等 (2010 )。 
6. 第 二 篇 即将 发 表 的 文章 被 作者 撤 
队 的 文章 首先 被 团队 部 分 成 员 撤 














回 了 (Lo 等 ，2012 )， 而 Mikovits 研究 团 








回 了 一 部 分 内 容 (Silverman 等 ，2011 )， 


后 来 又 被 《科学 》 杂 志 完 全 撤回 了 (Alberts，2011 )。 
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7. 其 他 研究 团队 向 人 们 解释 了 为 什么 这 些 结果 可 能 是 由 于 XMRYV 污染 造成 








的 ， 并 且 通 过 将 另外 两 种 病毒 结合 在 一 起 来 推断 出 这 种 病毒 实 











际 上 来 源 于 





实验 室 。 人 们 在 《逆转 录 病 毒 》 上 发 表 了 四 篇 专门 研究 这 一 污染 问题 的 文 
章 (Huk 等 , 2010; Oakes 等 ，2010; Robinson 等 ，2010; Sato 等 ，2010 )， 
后 来 又 有 人 发 表 了 一 篇 讨论 XMRV 的 来 源 的 文章 (Paprotka 等 ，2011 )。 


8. Cohen ( 2011 )。 
9. Alter 等 (2012 )。 
10. 皮尔 逊 相 关系 数 ( 由 Karl Pearson 提出 ) 从 数学 角度 被 定义 为 : 
X(X —X)\(¥-Y) 
JEX -XPI -YF 





























在 这 个 公式 中 ,也 表示 平均 数 。 注 意 ， 在 分 子 中 ， 我 们 将 某 一 测量 点 A 


平均 值 的 差 和 了 与 平均 值 的 差 的 乘积 累加 在 一 起 。 在 分 母 中 ， 

是 个 体 的 变化 量 。 

.在 皮尔 逮 相 关系 数 中 ， 我 们 需要 除 以 变量 标准 差 的 乘积 。 因 此 

个 标准 差 中 有 一 个 为 零 ， 这 个 系数 由 于 要 除 以 零 就 无 效 了 。 

12. 比如 说 ，Salganik 等 (2006 ) 曾 指出 ， 让 那些 歌曲 继续 流行 下 
不 可 预测 的 ， 他 们 还 证 实 了 流行 歌曲 的 成 功 并 不 完全 取决 于 歌 
想 要 了 解 更 多 这 方面 的 信息 ， 参 见 Watts (2011 )。 

13. Noseworthy 等 (1994 )。 





Ek 
= 






























































我 们 计算 的 





， 如 果 这 两 





去 的 方式 是 
曲 的 质量 。 


14. 想 要 阅读 更 多 关于 其 他 认 知 偏差 的 信息 , 参见 Tversky 和 Kahneman( 1974 ). 








15. Patberg 和 Rasker ( 2004 ); Redelmeier 和 Tversky ( 1996 )。 
16. DuHigg (2012 )。 

17. Narayanan 和 Shmatikov (2008 ). 

18. Koppett (1978 )。 

19. Messerli (2012 )。 

20. Pritchard (2012 )。 

21. Waxman (2012 )。 

22. Höfer (2004 ); Matthews (2000 )。 

23. Linthwaite 和 Fuller (2013 ). 

24. Heeger 和 Ress ( 2002 )。 

25. Bennett 等 (2011 )。 

26. Fisher (1925) 一 开始 曾 暗示 0.05 可 能 是 一 个 很 有 效 的 临界 值 
建议 所 有 人 在 任何 情况 下 都 应 该 使 用 0.05 作为 临界 值 。 





























， 但 他 并 不 
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27. Stoppard ( 1990 )。 有 趣 的 是 ， 硬 币 连续 出 现 正 














结果 相 比 增加 了 。 




















看 朝 上 的 次 数 与 最 初 投 挪 的 














28. 这 里 的 P 值 是 0.022。 因 为 出 现 10 次 正面 朝 上 (或 反面 朝 上 ) 的 概率 是 

















0.001， 而 出 现 9 次 正面 朝 上 (或 反面 朝 上 














在 一 起 正好 是 0.022。 





的 概率 是 0.01， 将 这 些 数值 加 


29. 想 要 详细 ( 且 专 业 地 ) 了 解 如 何 调整 以 便 进行 多 重 假设 检验 ， 参 见 Efron 


(2010 )。 





30. 有 观点 认为 ， 我 们 不 应 该 调整 ， 而 应 该 进行 多 重 对 比 。 想 要 了 解 这 个 观点 

















的 更 多 信息 ， 参 见 Rothman (1990 )。 








31. 我 们 将 在 第 6 曹 更 加 深入 地 讨论 这 个 问题 ， 并 且 探 讨 这 些 所 谓 的 违背 忠实 
原则 的 行为 是 如 何 影 响 我 们 通过 计算 推理 原因 的 能 力 的 。 
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时 间 如 何 影响 我 们 感知 因果 关系 和 
进行 因果 关系 推理 的 能 力 ? 


2001 年 ， 研 究 人 员 做 了 一 组 随机 对 照 实验 来 检测 祈祷 是 否 会 提升 病 
人 的 治疗 成 效 ， 比 如 缩短 病人 住院 的 时 间 。! 
) 召集 了 3393 名 血 流 感染 的 成 年 住院 病人 ， 其 中 大 





都 不 知道 谁 在 哪 一 组 














约 一 半分 到 了 控制 组 ， 














这 个 双 育 实验 (医生 和 病人 























还 有 一 半分 到 了 祈祷 干预 组 。 测 试 结果 显示 , 干预 














组 病人 的 住院 时 间 缩 短 了 ,发 烧 程 度 减轻 了 , 而 且 与 控制 组 相 比 , 这 两 个 
素 的 变化 程度 在 统计 学 上 都 具有 显著 性 (P 值 分 别 为 0.01 和 0.04 )。 
然而 ， 既 然 这 种 干预 措施 如 





呢 ? 其 中 一 个 原因 是 ， 














这 项 研究 




















这 意味 着 康复 祈祷 是 在 他 们 住院 
































E, $M ESS 


何 接触 。 








当下 的 一 个 原因 影响 了 过 去 发 生 的 事情 ， 





识 完全 相反 。 一 般 情 况 下 ， 原 因 的 出 现 往 


出 来 之 后 才 发 生 的 , 而且 禄 祷 发 生 的 地 点 和 时 间距 
离 病 人 住院 的 地 点 和 时 间 十 分 遥远 , 为 病人 祈祷 的 人 也 从 未 和 病人 有 过 任 





























在 时 间 上 不 是 很 接近 )， 而 且 原 因 和 结 














比 有 效 ， 那 它 为 什么 没有 被 所 有 医院 采 月 
的 病人 的 信 
旦 治疗 结果 出 来 之 后 很 久 才 发 生 的 。 实 际 











ad 





E 院 时 间 是 在 1990—1996 年 ， 











FE 往 要 先 于 结果 ( 即便 原因 和 结果 





O 




















这 与 我 们 对 因果 关系 的 认 





























之 间 会 存在 一 定 的 物理 联系 。 这 











项 研究 是 按照 随机 实验 的 常规 标准 ( 比如 双 盲 ) 进行 的 , 而 且 实 验 结果 在 
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统计 学 上 具有 显著 性 。 这 篇 文章 吸引 了 很 多 读者 , 他们 纷纷 来 信 , RAT 





这 篇 文章 的 哲学 与 宗教 意义 。 


但 是 ,问题 的 重点 不 是 信仰 。 相 反 ， 




















究 向 读者 提出 了 挑战 : 如 果 这 些 结论 来 自 一 项 符合 他 们 标准 的 研究 , 而 且 
研究 方法 合理 , 研究 结果 在 统计 学 上 也 具有 显著 和 


先 验 信念 极 为 矛盾 的 结论 吗 ? 





“当下 的 某 个 原因 能 够 导致 某 件 事情 在 过 去 发 生 ”"， 你 能 想象 到 有 哪 
BONS? 这 项 研究 看 似 合理 , 但 是 我 们 却 不 大 
关系 中 时 





个 研究 能 够 说 服 你 相信 这 种 到 
可 能 相信 这 一 结果 是 干预 措施 导致 的 , 因为 它 违反 了 我 们 对 因 引 















































E, 那么 他 们 会 接受 与 其 


这 项 研 











间 因 素 的 认识 。 如 果 你 对 一 个 假设 的 先 验 信念 足够 接近 实践 活动 , 那么 任 


=> 
Ez} 
































因 和 结果 之 间 的 延迟 。 如 果 你 和 一 个 得 了 流感 的 朋友 一 起 看 ! 


可 实验 可 能 都 不 会 真正 改变 你 的 想法 。 
尽管 事件 发 生 的 顺序 对 因 虽 




















关系 至 关 重 要 ， 但 是 我 们 也 十 分 在 意 原 


























[SIA 
Hae, =Z^H 


后 你 也 得 了 流感 , 那 你 可 能 不 会 认为 是 你 朋友 传染 给 你 的 。 但 如 果 你 认为 
那 你 为 什么 不 把 责任 推 到 你 朋友 身上 呢 ? 


接触 流感 病人 就 会 染 上 流感 ， 















































为 并 不 是 接触 了 某 个 病毒 就 会 生病 , 而 是 由 于 病毒 存在 潜伏 期 , 接触 某 个 





Pi 














病毒 并 不 会 立即 引发 相应 的 症状 , 而 ] 


目 也 不 会 导致 人 们 在 很 久 以 后 才 出 现 


流感 症状 。 实 际 上 ,接触 病毒 和 引发 疾病 之 间 的 时 间 很 短 , 我们 可 以 利用 
这 个 时 间 段 来 缩小 范围 ， 找 到 可 能 是 哪 一 次 接触 引发 了 某 个 疾病 。 


时 间 因 素 往往 能 让 我 们 


区 分 原因 和 结果 ( 体重 下 降 之 前 就 4 








EJS T, 





这 说 明 这 个 疾病 不 可 能 是 体重 下 降 引起 的 )、 能 让 我 们 的 干预 措施 发 挥 作 
用 (有 些 药物 必须 在 接触 病毒 后 立刻 服用 )， 还 能 让 我 们 预测 未 来 将 会 发 








生 的 事件 ( 知道 股票 价格 的 上 涨 时 














间 比 仅仅 知道 它 会 在 未 来 某 个 不 确定 的 


时 间 段 上 涨 更 有 用 ) 但 是 ， 时 间 可 能 也 会 造成 误导 ， 因 为 我 们 可 能 会 在 








毫 无 关联 的 、 具 有 相似 趋势 的 时 间 序 列 中 找到 相关 性 。 当 结 


出 现 延 迟 时 
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( 比如 接触 的 环境 与 健康 状况 )， 我 们 可 能 会 找 不 到 导致 这 一 结果 的 原因 。 
当 一 个 事件 经 常 发 生 在 另 一 事件 之 前 时 ( 卖 伞 的 小 贩 们 会 在 下 两 之 前 开始 
卖 爹 ,但 这 绝对 不 是 下 雨 的 原因 )， 我 们 可 能 会 错误 地 将 一 些 无 关 的 事件 
联系 在 一 起 。 











4.1 因果 关系 的 感知 











我 们 是 如 何 从 “运动 与 减肥 之 间 的 相关 性 ”推理 出 “是 运动 导致 体 
重 下 降 而 不 是 体重 下 降 导 致 运动 " 这 样 一 个 结论 的 呢 ? 相关 性 是 一 种 对 称 
关系 ( 身高 和 年 龄 之 间 的 相关 性 与 年 龄 和 身高 之 间 的 相关 性 完全 相同 )， 
但 因果 关系 却 是 不 对 称 的 ( 炎热 的 天 气 会 让 人 跑步 的 速度 放 慢 , 而 跑步 却 
不 能 引起 天 气 的 变化 )。 我 们 可 以 根据 背景 知识 了 解 到 人 们 跑步 的 速度 是 
不 可 能 影响 天 气 的 , 但 在 从 相关 性 到 提出 因果 假设 这 一 过 程 中 , 最 关键 的 
信息 之 一 就 是 时 间 。 

休 度 处 理 非 对 称 性 问题 的 方法 是 ， 默 认 原因 和 结果 不 可 能 同时 发 生 ， 
而 且 原 因 必须 先 于 结果 发 生 。 因 此 ， 如 果 我 们 观察 一 些 正常 发 生 的 事件 ， 
那 一 定 是 先 发 生 的 事件 导致 后 发 生 的 事件 。? 然而 ， 休 计 的 哲学 研究 主要 
是 理论 性 的 , 虽然 从 直觉 上 来 讲 , 我 们 依靠 时 间 上 的 优先 性 来 感知 因果 关 
系 是 没 问 题 的 ， 但 这 并 不 意味 着 事情 就 一 定 是 这 样 的 。 

如 果 我 们 看 到 一 个 台球 向 另 一 个 台球 滚动 并 且 撞击 了 它 ， 然 后 第 二 
个 台球 开始 向 前 滚动 , 我 们 会 自然 而 然 地 认为 第 二 个 台球 的 运动 是 第 一 个 
台球 引起 的 。 如果 第 二 个 台球 被 撞击 后 过 了 很 长 时 间 才 开始 滚动 , 或 者 第 
一 个 台球 并 没有 直接 撞 上 第 二 个 台球 , 而 是 在 离 第 二 个 台球 不 远 处 就 停 住 
了 ,那么 你 可 能 就 不 大 会 认为 第 二 个 台球 的 运动 是 第 一 个 台球 引起 的 了 。 
是 事件 发 生 的 时 间 导 致 了 人 们 对 因果 关系 的 感知 吗 ? 还 是 这 种 感知 取决 
于 空间 上 的 位 置 ? 
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为 了 弄 明白 这 一 点 ,我 们 再 次 回 到 第 2 章 提 到 的 心理 学 家 Albert Michotte 
的 研究 中 。20 世纪 40 年 代 ，Michotte 做 了 一 系列 实验 来 弄 清楚 时 间 和 空 
间 是 如 何 影响 人 们 对 因果 关系 的 感知 的 。 在 一 个 经 典 的 实验 中 ， 参 与 者 
看 到 两 个 影子 在 屏幕 上 移动 ,然后 他 们 要 描述 自己 都 看 到 了 什么 .Michotte 
试图 通过 改变 影子 的 运动 特征 ， 比 如 这 两 个 影子 之 间 是 否 有 接触 ,一 个 影 
子 的 运动 是 否 先 于 另 一 个 影子 , 从 而 确定 是 哪些 特征 导致 参与 者 产生 了 两 
者 之 间 具 有 因果 关系 的 印象 。 

在 因果 关系 感知 研究 中 ，Michotte 的 研究 影响 深远 。 当 然 , 他 的 研究 
在 研究 方法 和 研究 结果 的 证 明 上 也 存在 一 些 争 议 。 很 多 时 候 , 我 们 并 不 清 
楚 某 项 研究 的 参与 者 到 底 有 和 多少、 他 们 的 人 口 特征 是 什么 、 他 们 的 反应 从 
何 而 来 、 他 们 是 如 何 被 挑选 出 来 的 , 也 不 知道 这 些 参 与 者 的 具体 反应 到 底 
是 什么 , 以 及 为 什么 他 们 的 这 些 反应 会 被 看 成 是 有 因果 关系 的 。 Hi Michotte 
PK, 这 些 参与 者 很 多 都 是 同事 、 合 作者 和 学 生 一 一 由 这 些 参 与 者 组 成 的 群 
体 比 整个 人 口 群体 的 专业 性 要 高 。 尽 管 Michotte 的 研究 为 将 来 的 实验 研究 
提供 了 一 个 重要 的 起 点 ,但 他 的 研究 结论 还 需 进 一 步 地 复制 和 追踪 。” 
在 Michotte 的 实验 中 ， 有 两 个 影子 从 屏幕 上 经 过 ， 这 两 个 影子 没有 
发 生 任何 接触 且 同 时 开始 运动 ( 如 图 4-1a 所 示 )， 这 时 参与 者 往往 不 会 用 
因果 关系 来 描述 影子 的 运动 。’ 在 另 一 个 实验 中 ， 一 个 影子 朝 另 一 个 影子 
运动 ， 然 后 第 二 个 影子 在 接触 了 第 一 个 影子 后 也 开始 运动 ( 如 图 4-1b 所 
示 )。 在 这 种 情况 下 ， 参 与 者 通常 会 认为 是 第 一 个 影子 引起 了 第 二 个 影子 
的 运动 ,，" 并 会 使 用 一 些 表示 因果 的 语言 ( 比如 推动 、 发 动 等 ) 来 描述 两 
者 的 关系 。 这 些 场景 只 是 描绘 了 影子 在 屏幕 上 的 运动 过 程 , 它们 的 运动 轨 
迹 之 间 并 没有 真正 的 因果 依赖 性 , 但 人 们 依然 会 用 因果 关系 来 解释 和 描述 
整个 运动 过 程 。 观察 者 认为 第 二 个 影子 的 运动 是 由 第 一 个 影子 发 起 的 ， 
并 将 第 一 个 影子 看 成 一 个 发 动 器 , 这 种 现象 被 称 为 发 动 效应 。 值 得 注意 的 
是 ， 在 两 个 影子 之 间 加 入 空间 距离 ( 如 图 4-1c 所 示 ) 并 不 能 消除 人 们 认为 
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它们 之 间 存 在 因果 关系 的 印象 “如 果 事 件 发 生 的 顺序 不 变 , 一 个 影子 朝 着 
另 一 个 影子 运动 , 在 碰 到 男 一 个 影子 之 前 停 了 下 来 , 然后 男 一 个 影子 在 第 
一 个 影子 停 下 后 立刻 开始 运动 ， 那 么 参与 者 仍然 会 使 用 一 些 表 示 因 果 的 
语言 来 描述 这 一 过 程 。 从 这 个 实验 可 以 看 出 , 有 些 情况 下 , 与 空间 邻近 性 
HEE, 时间 上 的 优先 性 可 能 是 一 个 更 为 重要 的 信号 。 当 然 , 这 也 要 看 问题 
本 身 的 特点 以 及 事物 之 间 的 空间 距离 到 底 有 多 大 。 
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(d) 延迟 发 动 
图 4-1 上 面 几 张 图 展示 的 是 Michotte 所 做 的 各 种 实验 中 的 几 种 。 在 








这 儿 种 实验 中 , 影子 以 不 同 的 方式 运动 。 箭 头 表示 这 个 影子 
正在 运动 以 及 它 运动 的 方向 


尽管 我 们 并 不 能 根据 发 表 出 来 的 描述 文字 准确 地 复制 这 个 实验 当初 
所 用 的 方法 , 但 还 是 通过 其 他 研究 活动 证 实 了 发 动 效应 。 但 我 们 证 实 的 发 
动 效应 的 普遍 性 比 Michotte 暗示 的 低 , 可 能 只 有 64%~87% 的 观察 者 在 第 
一 次 看 到 一 个 运动 时 会 用 含有 因果 关系 的 语言 来 描述 这 个 运动 。” 

假设 一 个 球 正在 滚 向 另 一 个 球 。 第 一 个 球 一 接触 到 第 二 个 球 就 停 了 
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下 来 ,在 短暂 停顿 之 后 , 第 二 个 球 按照 第 一 个 球 的 运动 方向 开始 深 动 。 第 














二 个 球 的 运动 是 第 一 个 球 引 起 的 吗 ? 停顿 的 时 间 是 1 秒 还 是 10 秒 很 重要 
吗 ? 休 席 认为 时 空 上 的 邻近 性 对 因果 关系 的 推理 十 分 重要 ， 但 在 实践 中 ， 
我 们 无 法 看 到 每 个 因果 关系 链 中 的 每 一 个 环节 。 为 了 考察 延迟 是 如 何 影响 
人 们 对 因果 关系 的 判断 的 ，Michotte 设计 了 一 些 和 上 述 实验 一 样 的 场景 ， 
在 一 个 影子 结束 运动 之 后 , 男 一 个 影子 过 一 段 时 间 再 开始 运动 , 如 图 4-1d 
所 示 。 他 发 现 尽管 两 个 影子 之 间 的 距离 十 分 接近 ( 这 些 影子 确实 有 接触 )， 
但 时 间 上 的 延迟 消除 了 人 们 认为 这 两 个 运动 之 间 存 在 因果 关系 的 印象 。" 

除了 参与 者 的 专业 水 平 ( 以 及 参与 者 对 实验 和 Michotte 提出 的 假设 
的 了 解 程度 ) 外 ,这 些 实验 还 有 一 个 局 限 性 ,就 是 参与 者 只 是 描述 了 这 些 





























































































































影子 在 屏幕 上 的 行为 , 而 没有 试图 通过 与 这 种 行为 进行 互动 来 发 现 系 统 的 
各 个 特性 。 描 述 与 互动 的 差异 就 好 像 一 个 是 看 别人 按 电梯 按钮 然后 等 电梯 
什么 时 候 会 来 ， 一 个 是 按照 自己 的 时 间 来 选择 什么 时 候 按 电梯 按钮 。 


Michotte 





言 来 描述 一 些 场景 , 但 在 一 个 物理 系统 中 , 如 果 参 与 者 能 够 控制 原因 发 生 


的 时 间 , 





的 贡献 ， 



























































的 研究 告诉 我 们 , 人 们 在 特定 情况 下 可 能 会 用 表示 因果 关系 的 语 
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又 会 出 现 什么 情况 呢 ? 


在 Michotte 的 研究 基础 上 , Shanks, Pearson 和 Dickinson 也 做 了 很 大 


他 们 研究 了 时 间 对 因果 关系 判断 力 的 调节 作用 , 而 且 将 系统 变 成 





了 参与 者 之 间 互 动 的 工具 。 在 这 个 实验 中 , 按 下 键盘 上 的 空格 键 , 电脑 屏 
幕 上 就 会 出 现 一 个 闪烁 的 三 角 图 形 , 而 参与 者 必须 判断 按 空格 键 的 行为 在 
多 大 程度 上 导致 了 这 个 三 角形 的 出 现 。 

研究 人 员 将 按 空格 键 和 出 现 三 角形 这 两 件 事情 之 间 的 延迟 时 间 从 0 秒 
延长 到 了 2 秒 , 然后 发 现 这 种 延长 导致 参与 者 认为 空格 键 引起 三 角形 出 现 


的 可 能 怕 






































FE 变 小 了 。 研究 人 员 又 使 用 一 系列 的 延迟 时 间 (从 0 秒 到 16 秒 ) 进 








行 了 试验 ,然后 他 们 发 现 ，, 平均 来 说 ， 按 空格 键 的 行为 与 出 现 三 角形 的 效 
果 之 间 的 延迟 越 长 ， 参 与 者 认为 这 两 者 之 间 存 在 因果 关系 的 可 能 性 就 越 低 。 
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在 使 用 实体 对 象 做 实验 时 ， 如 果 在 两 个 物体 发 生 接 触 后 ， 其 中 一 个 
物体 隔 了 很 长 时 间 才 开始 运动 , 那么 我 们 完全 有 理由 怀疑 这 个 物体 的 运动 
并 不 是 另 一 个 物体 引起 的 。 但 在 其 他 情况 下 , 我 们 不 应 该 指望 某 个 结果 会 
立即 出 现 。 接触 一 个 病原 体 并 不 会 立即 让 人 生病 , 干预 政策 可 能 需要 很 多 
年 才能 产生 可 衡量 的 效果 , 通过 运动 来 减肥 是 一 个 缓慢 的 过 程 。 这 些 实验 
似乎 表明 , 原因 和 结果 之 间 的 延迟 会 减少 人 们 对 因果 关系 的 判定 , 或 者 导 
致 人 们 做 出 错误 的 推理 ， 这 样 的 结论 似乎 就 存在 问题 了 。 

最 近 有 研究 发 现 ， 尽 管 原因 和 结果 之 间 的 延迟 会 增加 人 们 准确 判断 
因果 关系 的 难度 , 但 这 在 一 定 程 度 上 也 可 能 取决 于 人 们 对 这 种 延迟 的 不 同 
预期 。 如 果 在 击 打 高 尔 夫 球 和 高 尔 夫 球 飞 出 去 之 间 出 现 了 10 分 钟 的 延迟 ， 
这 就 与 我 们 所 知道 的 物理 知识 严重 矛盾 。 但 如 果 一 个 人 接触 了 致癌 物 , 然 
后 在 十 年 之 后 才 得 了 癌症 , 这 么 长 的 延迟 却 不 会 让 人 觉得 意外 。 延迟 的 长 
度 对 我 们 的 影响 可 能 有 一 部 分 取决 于 我 们 对 问题 的 认识 , 以 及 我 们 对 事物 
运行 机 制 的 了 解 。 在 目前 提 到 的 心理 实验 中 , 有 很 多 心理 实验 的 设置 总 能 
让 参与 者 想起 一 些 熟悉 的 场景 。 在 一 些 场景 中 , 他 们 预计 某 个 原因 会 立即 
引发 某 种 结果 。 比 如 说 ，Michotte 移动 的 圆圈 代表 一 些 圆 球 ( 在 这 个 实验 
中 ， 人 们 认为 第 二 个 球 在 被 撞击 之 后 会 立即 滚动 起 来 ， 而 撞击 和 滚动 之 
间 的 任何 延迟 都 是 异常 的 ), 而 Shanks 等 人 在 研究 中 用 的 则 是 键盘 (在 这 
个 实验 中 ， 人 们 预计 在 按 下 空格 键 之 后 ， 电 脑 屏幕 很 快 就 会 出 现 反应 )。 
如 果 我 们 给 参与 者 一 些 场景 , 比如 让 参与 者 判断 吸烟 是 否 是 某 个 病人 得 瘤 
症 的 原因 , 然后 告诉 参与 者 某 个 人 的 吸烟 历史 和 肺癌 的 诊断 结论 , 那么 参 
与 者 有 可 能 会 发 现 ， 一 个 一 周 前 开始 吸烟 的 人 在 一 周 后 被 诊断 为 癌症 的 
可 能 性 极 小 ， 因 为 吸烟 可 能 需要 更 长 的 时 间 才 能 引起 癌症 。 

为 了 研究 这 个 问题 ，Buehner 和 May 做 了 一 个 与 Shanks 等 人 的 研究 
类 似 的 实验 。 但 在 这 个 实验 中 , Buehner 和 May 给 了 参与 者 一 些 背 景 知 识 ， 
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告诉 他 们 在 按 下 按键 和 屏幕 上 出 现 三 角形 之 间 可 能 会 有 延迟 ， 由 此 操纵 
了 参与 者 对 延迟 的 预期 。 参与 者 被 分 为 两 组 , 其 中 只 有 一 组 参与 者 ( 实验 
组 ) 提前 被 告知 在 按 按键 和 屏幕 上 出 现 三 角形 之 间 可 能 会 有 延迟 。 在 对 比 
了 两 组 实验 结果 之 后 ,我 们 发 现 尽 管 时 间 上 的 延迟 总 会 导致 人 们 降低 对 因 
果 关 系 的 判定 指数 , 但 这 种 延迟 对 实验 组 的 影响 要 小 得 多 。 此 外 , 实验 的 
顺序 ( 参与 者 是 先 看 到 有 延迟 的 效果 , 还 是 先 看 到 没有 延迟 的 效果 ) 也 会 
对 实验 结果 产生 显著 的 影响 。 如 果 参 与 者 先 看 到 的 是 有 延迟 的 效果 , 那么 
他 们 感受 到 的 因果 关系 的 强度 要 比 先 看 到 没有 延迟 的 效果 高 得 多 。 由 于 实 
验 顺序 不 同 而 产生 的 这 一 影响 表明 , 影响 我 们 判断 的 不 仅 是 事件 发 生 的 顺 
序 或 者 事件 之 间 的 延迟 长 度 ， 还 有 这 些 因素 和 先 验 知识 的 相互 作用 。 在 
Michotte 的 实验 中 ,参与 者 看 到 圆圈 在 屏幕 上 移动 ， 但 是 他 们 对 这 些 圆 
圈 的 解释 却 好 像 它们 是 实体 对 象 一 样 ， 因 此 他 们 的 解释 中 还 包括 他 们 对 
动力 传递 的 预期 。 
在 Buehner 和 May 的 研究 中 ， 参 与 者 提前 被 告知 的 信息 限制 了 时 间 
上 的 延迟 对 因果 关系 判断 的 影响 ， 但 即使 参与 者 已 经 知道 会 存在 这 种 滞 
后 ， 它 依然 会 影响 他 们 对 因果 关系 的 判断 ， 这 就 很 奇怪 了 。 之 所 以 会 出 现 
这 一 现象 ， 可 能 是 因为 实验 内 容 仍然 包括 按键 后 屏幕 上 就 会 出 现 某 种 效 
果 。 也 有 可 能 是 因为 人 们 对 计算 机 处 理 输入 指令 的 反应 速度 已 经 有 了 强烈 
的 预期 , 无 法 通过 预先 说 明 来 消除 这 种 预期 。 即 使 参与 者 已 经 提前 知道 可 
能 会 存在 延迟 , 他 们 还 是 会 利用 先前 对 按键 后 的 屏幕 反应 速度 的 预期 来 进 
行 因果 判断 。 

后 来 ， 研 究 人 员 用 一 个 节能 灯 的 例子 (参与 者 可 能 都 遇 到 过 从 按 开 
关 到 亮 灯 之 间 的 延迟 ) 成 功 消 除了 延迟 对 人 们 判定 因果 关系 的 负面 影响 。 
在 这 个 实验 中 ， 那 些 被 告知 可 能 会 有 延迟 的 参与 者 无 论 是 在 有 延迟 的 情况 
下 还 是 在 没有 延迟 的 情况 下 , 他 们 对 因果 关系 判定 的 平均 值 都 是 一 样 的 。” 









































































































































































































































在 上 述 两 种 情况 下 ， 虽 然 延 迟 已 经 不 再 影响 我 们 
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对 因果 关系 的 判断 ， 


但 参与 者 依然 认为 即时 效应 是 由 某 个 原因 导致 的 。 即便 他 们 所 得 到 的 一 些 
与 问题 有 关 的 信息 并 不 支持 这 样 的 结论 , 他 们 也 依然 这 样 认为 。 我 们 所 面 
临 的 挑战 之 一 是 , 要 设计 一 个 能 够 保证 参与 者 对 延迟 的 长 度 有 着 强烈 预期 
的 实验 , 并 且 还 要 保证 这 些 预 期 与 他 们 先前 对 事物 的 作用 机 制 的 认识 相 一 





致 。 有 一 个 实验 利用 了 一 个 倾斜 的 盘子 , 让 一 颗 弹 珠 从 高 处 进入 盘 内 并 一 












































直 向 低 处 滚动 直到 见 底 , 然后 去 触发 盘子 底部 一 个 控制 灯光 的 开关 。 盘 子 





的 角度 可 以 调整 。 如 果盘 子 几乎 是 垂直 于 地 面 的 , 那么 在 弹 珠 进入 盘 内 和 























灯光 亮 起 来 这 两 件 事情 之 间 几 乎 不 可 能 出 现 延 迟 ; 如 与 





盘子 几乎 是 平行 于 





地 面 的 , 那么 这 两 件 事情 之 间 就 很 有 可 能 出 现 延 迟 。 这 和 第 2 章 提 到 的 心 
理学 实验 中 所 使 用 的 快 与 慢 的 机 械 装 置 相似 。 通 过 这 种 设置 ，Buehner 和 
McGregor 证 实 了 这 一 点 : 有 些 情况 下 ， 即 时 效应 可 能 会 降低 一 个 原因 的 
可 信和 度 。 之 前 的 大 部 分 研究 都 表明 , 延迟 增加 了 寻找 原因 的 难度 ,即便 没 
有 增加 难度 ， 最 多 也 只 是 不 影响 推论 活动 。 但 Buehner 和 McGregor 的 研 
究 表明 , 在 有 些 情 况 下 ,延迟 居然 会 对 寻找 原因 的 活动 有 所 帮助 ( 延迟 短 
和 盘子 的 倾斜 度 比较 低 这 两 个 因素 会 降低 两 个 事件 之 间 存 在 因果 关系 的 
可 能 性 )。 这 一 发 现 至 关 重 要 ， 它 表明 延迟 并 不 总 是 会 妨碍 我 们 的 推理 活 






































动 , 也 不 总 是 会 降低 原因 的 可 能 性 。 就 时 间 问 题 而 言 ， 
察 到 的 延迟 与 我 们 预期 的 延迟 之 间 的 关系 。 


























最 重要 的 是 我 们 观 


这 些 实验 中 需要 注意 的 主要 问题 是 ， 按 下 按键 后 会 在 多 大 程度 上 引 
发 视觉 效果 , 或 者 是 否 是 弹 珠 让 灯亮 了 起 来 ,而 不 是 去 辨别 多 种 可 能 的 原 




















因 。 通 常情 况 下 , 我 们 不 仅 需要 判断 一 个 特定 事件 引起 某 种 结果 的 可 能 性 
































有 多 大 ， 而 且 还 要 假设 哪些 因素 可 能 会 是 首要 原因 。 如 果 你 食物 中 毒 了 ， 
那 不 仅 要 考察 某 个 食物 是 不 是 中 毒 的 原因 , 还 要 考察 你 所 吃 过 的 所 有 食物 
来 判定 罪魁 祸首 。 这 时 候 , 时间 可 能 会 是 一 个 重要 的 线索 ,因为 上 周 吃 的 
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食物 不 大 可 能 是 罪魁 祸首 ， 而 最 近 吃 的 食物 则 更 有 可 能 是 中 毒 的 原因 。 

















有 些 心 理学 研究 为 这 种 类 型 的 推理 提供 了 依据 。 这 些 研究 表明 ， 在 

















因果 关系 未 明 的 情况 下 , 时 间 信 息 可 能 确实 会 比 其 他 线索 ( 比如 这 些 事件 
同时 发 生 的 概率 有 多 大 ) 更 加 重要 。 然而, 这 也 可 能 会 导致 我 们 推理 出 错 
误 的 结论 。 在 食物 中 毒 的 案例 中 , 你 可 能 会 仅 依据 时 间 因 素 就 将 最 近 吃 的 
东西 错误 地 当成 罪魁 祸首 , 而 忽视 了 其 他 信息 ,比如 哪些 食物 或 者 哪些 饭 
































店 与 食物 中 毒 的 联系 最 为 密切 。Lagnado 和 Sloman 所 做 的 一 项 研究 表明 ， 
即便 我 们 告知 参与 者 可 能 会 有 延迟 , 这 些 延 迟 可 能 让 他 们 观察 到 的 各 个 事 


件 之 间 的 顺序 不 那么 可 靠 , 这 些 参与 者 依然 会 根据 一 些 因果 联系 得 出 错误 
的 结论 。 即 便 参 与 者 观察 到 的 这 些 因 素 共 同 出 现 的 次 数 与 时 间 信 息 矛 盾 ， 


















































他 们 依然 会 依赖 时 间 信 息 来 发 现 各 种 关系 。 





假设 你 在 按 一 个 开关 。 你 不 太 清 楚 这 个 开关 是 干什么 的 ， 所 以 你 按 





了 它 很 多 次 。 有 时 你 一 按 开关 就 有 一 慢 灯 亮 了 , 但 有 时 要 过 一 会 儿 灯 才 会 
亮 。 有 时 这 中 间 会 有 1 分 钟 的 延迟 ， 有 时 会 有 长 达 5 分 钟 的 延迟 。 是 这 个 
开关 打开 了 灯 吗 ? 这 有 点 像 按 人 行道 过 街 按钮 的 结果 , 按 下 按钮 似乎 并 不 
会 让 信号 灯 快 点 切换 。 很 难 判断 二 者 之 间 是 否 存 在 因果 关系 , 因为 按 按钮 
和 信号 灯 切 换 之 间 的 时 间 间 隔 变化 太 大 。 关 于 改变 延迟 稳定 性 的 实验 表 


明 ， 



































如 有 果 原 因 和 结果 之 间 的 浪 后 情况 稳定 ( 比如 “三 角形 总 是 在 按 下 按键 








4 秒 之 后 出 现在 屏幕 上 ”与 “三 角形 总 是 在 按 下 按键 2 秒 到 6 秒 之 后 出 现 
在 屏幕 上 ”), 那么 人 们 对 因果 关系 的 评分 就 会 比较 高 , 随 着 时 间 间 隔 的 变 
化 范围 不 断 扩 大 ， 因 果 关 系 的 评分 也 会 不 断 变 低 。” 从 直觉 上 来 说 ， 如 果 


时 i 


























司 间隔 在 平均 值 上 下 略微 浮动 , 那么 很 有 可 能 是 其 他 因素 的 细微 变化 或 














者 是 观察 过 程 中 的 延迟 造成 的 。 相 反 ， 如 果 时 间 间 隔 的 变化 范围 巨大 , 比 
如 一 种 药物 在 服药 后 的 1 天 到 10 年 出 现 副 作用 , 那么 很 有 可 能 还 存在 其 
他 能 够 决定 时 间 间 隔 (加快 或 延迟 某 种 结果 出 现 的 时 间 ) 的 因素 ， 而 且 
可 能 有 不 止 一 种 原 果 机 制 或 存在 某 种 混乱 的 关系 。 
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4.2 时 间 的 方向 性 

















假设 有 个 朋友 跟 你 说 某 种 新 药 对 她 的 过 敏 有 效 。 如 果 她 说 这 种 新 药 
让 她 不 打 喷 喧 了 , 那么 你 会 怎样 假定 开始 吃 药 和 不 打 喷 喧 之 间 的 顺序 呢 ? 
根据 我 们 暗示 的 这 种 关系 ， 你 很 可 能 会 认为 吃 药 在 前 ,停止 打 喷 嘎 在 后 。 
事实 上 , 时 间 可 以 帮助 我 们 寻找 事件 发 生 的 原因 , 它 和 因果 关系 之 间 的 紧 
密 联系 也 能 让 我 们 从 因果 关系 中 推理 出 关于 时 间 的 信息 。 有 些 研究 发 现 ， 
关于 原因 的 了 解 会 影响 我 们 感知 事件 之 间 时 间 间 隔 的 方式 , “甚至 还 会 影 
响 我 们 感知 事件 发 生 顺 序 的 方式 。” 

有 时 两 个 事件 看 起 来 好 像 是 同时 发 生 的， 但 其 实 是 测量 粒度 或 观察 能 
力 有 限 导 致 的 。 比 如 ， 微 阵列 实验 一 次 检测 数 千 个 基因 的 活动 情况 ， 而 对 
基因 活动 水 平 的 检测 通常 是 按 固定 的 时 间 间 隔 ( 比如 每 小 时 一 次 ) 进行 的 。 
从 数据 上 看 , 两 个 基因 的 活动 模式 看 起 来 好 像 是 一 样 的 一 一 同时 出 现 过 度 
表达 或 者 低 表 达 。 然而 , 事实 可 能 是 那个 被 上 调 的 基因 引起 男 一 个 基因 随 
即 也 被 上 调 。 但 是 ,如 果 我 们 看 不 到 这 种 排序 ,而 且 也 没有 任何 背景 知识 
表明 肯定 有 一 个 基因 先 发 生 了 变化 ,那么 我 们 能 确定 的 只 是 这 两 个 基因 的 
表达 水 平 是 相关 的 ， 而 无 法 确定 一 个 基因 是 否 会 导致 为 一 个 基因 被 调节 。 

同样 ,病历 所 记录 的 并 不 是 每 个 病人 每 天 的 数据 信息 ， 而 是 一 系列 
不 规则 的 时 间 点 (病人 去 看 医生 的 时 间 点 ) 的 数据 信息 。 因 此 , 我 们 可 能 
会 发 现 某 个 病人 在 某 个 时 期 既 在 服用 某 种 药物 ， 又 在 忍受 着 某 个 副作用 。 
但 是 , 我 们 只 知道 这 两 件 事情 都 发 生 了 , 却 不 知道 病人 是 否 是 先 服药 后 出 
现 的 副作用 , 也 不 知道 这 个 药物 是 否 是 引起 这 个 副作用 的 潜在 原因 。 在 一 
些 长 期 队列 研究 中 , 参与 者 可 能 每 年 才 接受 一 次 调查 , 所 以 如 果 环 境 暴露 
或 者 其 他 因素 在 短期 内 对 参与 者 产生 了 某 种 影响 , 那么 这 一 因果 序列 是 无 
法 通过 这 种 长 期 的 队列 研究 而 被 发 现 的 ( 假设 这 些 事 件 可 以 被 准确 地 回忆 
起 来 )。 在 很 多 情况 下 ， 两 个 事件 中 的 任何 一 个 事件 都 有 可 能 先 发 生 ， 而 
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它们 共同 出 现 并 不 代表 两 者 之 间 存 在 某 种 特定 的 因果 顺序 。 

没有 任何 时 间 信 息 的 情况 是 最 复杂 的 ， 比 如 在 横断 面 研究 中 ， 所 有 
数据 都 是 在 同一 时 间 收 集 的 。 某 个 横断 面 研究 调查 了 某 个 人 群 中 的 任意 一 
个 小 群体 , 以 此 来 判断 癌症 和 某 个 特定 病毒 之 间 是 否 有 联系 。 如 有 果 不 知道 
哪个 事件 发 生 在 前 , 我 们 就 无 法 知道 它们 之 间 是 否 存在 因果 关系 ; 即使 它 
们 之 间 看 起 来 好 像 有 相关 性 , 我 们 也 无 法 知道 到 底 哪 一 个 是 因 , 哪 一 个 是 
果 ( 是 这 种 病毒 引起 了 癌症 ， 还 是 癌症 让 人 们 更 容易 感染 这 种 病毒 )。 如 
果 我 们 基于 对 事件 发 生 顺 序 的 先 验 观念 来 假定 因果 关系 ， 而 不 是 基于 事 
件 发 生 的 真实 顺序 , 那么 就 有 可 能 误 认为 两 者 之 间 存 在 因果 关系 ,而 实际 
上 我 们 所 发 现 的 不 过 是 相关 性 而 已 。 比 如 说 ,， 人 们 做 了 很 多 研究 来 确定 肥 
胖 和 离婚 这 样 的 现象 是 否 会 因为 社会 关系 的 影响 而 通过 社交 网 络 传染 给 他 
人 。 在 没有 时 间 信 息 的 情况 下， 我们 无 法 得 知 这 些 事件 的 合理 发 生 顺 序 。" 

有 些 哲学 家 ( 比如 Hans Reichenbach ) 曾 试 图 在 不 使 用 时 间 信 息 (而 
是 从 因果 关系 的 方向 性 中 来 获知 事件 发 生 的 顺序 ) 的 情况 下 从 概率 的 角 
度 界 定 因果 关系 ,“ 而 且 有 一 些 计算 方法 在 特殊 情况 下 不 需要 时 间 信 息 也 
能 确定 因果 关系 。 ”但 是 ， 绝 大 部 分 方法 仍然 会 假定 原因 先 于 结果 ， 并且 
在 能 够 获取 时 间 信 息 的 情况 下 ， 使 用 时 间 信 息 来 确定 因果 关系 。 

有 些 时 候 原 因 和 结果 似乎 真 的 是 同时 发 生 的 ， 所 以 我 们 无 论 使 用 时 
间 尺 度 也 无 法 区 分 到 底 哪 一 个 在 前 ， 哪 一 个 在 后 。 这 样 的 例子 并 不 多 ， 
而 其 中 就 有 一 个 来 自 于 物理 学 的 例子 。 在 爱 因 斯 坦 - 波多 尔 斯 基 - RR 
(EPR ) 悖 论 中 ， 两 个 粒子 处 于 纠缠 态 ， 所 以 如 果 一 个 粒子 的 动量 或 坐标 
发 生 改 变 ， 另 一 个 粒子 的 动量 和 坐标 也 会 发 生 相 应 的 变化 来 与 之 匹配 。” 
这 看 起 来 似乎 很 反常 , 因为 两 个 粒子 在 空间 上 是 分 离 的 , 但 这 个 变化 却 是 
瞬间 发 生 的 , 这 就 让 人 不 得 不 认为 有 的 因果 关系 是 不 存在 空间 邻近 性 或 时 
间 优 先 性 的 〈 我们 所 认为 的 因果 关系 的 两 个 关键 特征 )。 爱 因 斯 坦 将 这 种 
异地 的 因果 关系 称 为 “幽灵 般 的 超 距离 作用 ”，” 因 为 超越 空间 的 因果 关 







































































































































































































































































第 4 章 时 间 | 85 








系 要 求 信息 传递 的 速度 比 光速 还 快 ， 而 这 是 不 符合 经 典 物理 学 理论 的 。” 
这 一 点 无 论 是 在 物理 学 家 中 还 是 在 哲学 家 中 都 存在 很 多 争议 。” 

有 人 建议 使 用 反 向 因果 关系 〈 有 时 也 叫 逆向 因果 关系 ) 来 解决 EPR 
悖 论 。 也 就 是 说 ,原因 不 仅 可 以 影响 将 来 发 生 的 事件 ,还 可 以 影响 过 去 发 
生 的 事件 。 当 纠缠 态 中 的 一 个 粒子 的 状态 发 生 改 变 时 , 它 会 在 过 去 的 一 个 
时 间 点 给 纠缠 态 中 的 男 一 个 粒子 发 送 一 个 信和 号, 让 另 一 个 粒子 也 改变 自己 
的 状态 , 那么 这 时 的 状态 变化 就 不 要 求 信息 的 传递 速度 超过 光速 了 ( 尽 
这 样 可 能 会 产生 某 种 量子 时 间 旅 行 )。” 然 而 在 本 书 中 ， 我 们 把 “时 间 只 
能 朝 一 个 方向 运动 ”作为 一 个 给 定 的 条 件 , 把 “原因 必须 早 于 结果 ”也 
为 一 个 给 定 的 条 件 ， 即 便 我 们 并 没有 看 出 事件 的 先后 顺序 。 
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4.3” 当 事物 随 着 时 间 变 化 的 时 候 





海盗 数量 减少 会 导致 全 球 气温 上 升 吗 ? 吃 马 苏 里 拉 奶 酷 会 导致 人 们 
去 报考 计算 机 专业 吗 ? “柠檬 的 进口 数量 会 导致 公路 死亡 人 数 减少 吗 ? 

图 4-2a 反映 的 是 柠檬 的 进口 数量 和 公路 死亡 人 数 之 间 的 关系 。 该 图 
显示 ， 随 着 柠檬 进口 数量 的 增加 ， 公 路 的 死亡 人 数 下 降 了 。 “这 些 数 据 的 
皮尔 逊 相关 系数 达到 了 -0.98， 意 味 着 这 两 件 事情 之 间 存 在 着 几 近 完美 的 
负 相 关 关 系 。 但 是 , 目前 还 没有 任何 人 提议 通过 增加 柠檬 进口 量 来 减少 交 
通 事故 的 死亡 人 数 。 

现在 让 我 们 看 看 图 4-2b 的 情况 。 在 这 个 图 中 , 我 们 将 进口 数量 和 死亡 
人 数 都 绘 成 了 随 着 时 间 变 化 的 函数 。 该 图 显示 ， 随 着 时 间 的 变化 ， 进 口 数 
量 稳定 减少 , 而 同一 时 期 的 死亡 人数 则 在 不 断 增加 。 图 4-2a 中 的 数据 实际 
上 也 是 一 个 时 间 序列 个 按照 逆向 时 间 顺 序 排列 的 序列 。 我 们 也 可 以 
用 其 他 随 着 时 间 递 减 的 序列 ( 比如 正 浏 览 器 的 市 场 份额 .北冰洋 的 含 冰 量 、 
美国 的 吸烟 率 等 ) 来 代 蔡 柠檬 的 进口 数量 ， 并 从 中 找到 完全 一 样 的 关系 。 
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(a) (b) 
图 4-2 ”美国 进口 柠檬 的 数量 ( 以 公吨 计算 ) 和 美国 公路 死亡 人 数 ( 
10 万 人 中 的 死亡 人 数 ): Ca) 相关 函数 和 (b ) 随时 间 变 化 的 



































其 原因 是 这 些 时 间 序 列 是 不 稳定 的 ， 这 意味 着 像 平均 值 这 样 的 属性 
会 随 着 时 间 的 变化 而 变化 。 即便 我 们 改变 方差 来 维持 柠檬 的 平均 进口 数量 
的 稳定 性 ， 但 是 各 个 年 份 之 间 的 上 下 波动 却 是 不 稳定 的 。“ 随 时 间 变 化 的 
电力 需求 不 稳定 ”有 两 个 原因 : 首先 总 体 上 来 说 ,电力 需求 很 可 能 会 随 着 
时 间 的 变化 而 不 断 增 加 ; 其 次 ,电力 需求 还 具有 季节 性 特征 。 而 多 次 抛 硬 
币 的 结果 则 是 稳定 的 , 因为 每 抛 一 次 硬币 , 正面 朝 上 和 反面 朝 上 的 概率 都 
是 完全 一 样 的 。 

出 现 类 似 的 〈 或 者 完全 相反 的 ) 随时 间 变 化 的 趋势 可 能 说 明 某 些 时 
间 序 列 之 间 具 有 相关 性 ， 但 这 并 不 意味 着 它们 之 间 就 存在 因果 关系 。 相 
反 , 这 正 是 我 们 寻找 没有 任何 对 应 因果 关系 的 相关 性 的 另 一 种 方法 。 如 果 
一 组 股票 的 价格 在 某 一 段 时 期 内 都 在 上 涨 , 那么 即便 这 些 股票 价格 每 天 的 
变化 趋势 都 过 然 不 同 , 我 们 可 能 依然 会 发 现 它们 之 间 存 在 各 种 相关 性 。 在 
如 图 4-3 所 示 的 例子 中 ， 自 闭 症 患 者 的 确诊 人 数 的 增长 速度 似乎 和 星巴克 
咖啡 店 数量 的 增长 速度 相似 , ”因为 这 两 者 的 数量 碰巧 都 是 按 指 数 级 增长 
的 ,但 很 多 其 他 时 间 序 列 的 增长 速度 也 是 如 此 ( 比如 GDP、 网 页 数量 和 
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科技 文献 数量 )。 显然 , 这 种 序列 中 存在 因果 关系 的 可 能 性 很 小 , 但 并 不 
是 所 有 序列 都 如 此 显而易见 ， 而 且 很 多 相关 的 时 间 序 列 都 能 找到 一 个 令 
人 信服 的 解释 。 如 果 我 们 选择 的 是 其 他 时 间 序 列 ， 比 如 装 了 宽带 的 家 庭 
的 比例 ， 那 么 除了 这 两 者 碰巧 都 在 增长 以 外 ， 我 们 无 法 找到 更 多 的 证 据 来 
证 明 两 者 之 间 存 在 联系 。 但 可 能 仍然 有 人 想 要 找 出 一 个 解释 来 说 明 为 什么 
这 两 者 之 间 可 能 存在 联系 。 然而, 这 依然 只 是 一 种 相关 性 ， 如 果 我 们 去 考 
察 不 同 层 次 的 时 间 粒 度 , 或 者 根据 数据 的 不 稳定 性 做 一 些 调整 , 这 种 相关 
性 可 能 就 会 完全 消失 。 



































年 度 
一 @ 一 星巴克 咖啡 店 的 数量 - 虽 - 自 闭 症 患者 的 确诊 人 数 























图 4-3 ”两 个 不 稳定 的 时 间 序 列 看 起 来 好 像 具 有 相关 性 , 但 这 只 是 因 
为 它们 都 在 随 着 时 间 以 指数 级 的 速度 增长 


另外 一 种 类 型 的 不 稳定 性 是 由 于 被 抽样 调查 的 人 群 本 身 也 在 随 着 时 
间 而 改变 。2013 年 ， 美 国 心脏 病 协会 (AHA ) 和 美国 心脏 病 学 会 ( ACC ) 
颁布 了 新 的 胆固醇 治疗 指导 原则 并 发 布 了 一 个 在 线 计算 器 , 用 于 测算 患者 
在 10 年 内 心脏 病 发 作 或 者 中 风 的 风险 。” 但 有 些 研究 人 员 发 现 这 个 计算 
器 高 估 了 75%~150% 的 发 病 风 险 , 而 这 可 能 会 导致 严重 的 过 度 治疗 , 因为 
] 药 指导 原则 是 以 每 个 病人 发 病 的 风险 级 别 作为 基础 的 。” 
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这 个 计算 器 


没有 (也 不 可 能 ) 向 患者 询问 所 有 可 能 会 影响 风险 级 别 的 因素 ， 比 如 吸 ; 
史 的 一 些 细节 。 等 式 中 的 相关 系数 ( 每 个 因素 对 风险 级 别 的 影响 程度 ) 是 














考虑 了 糖尿 病 、 高 血压 和 当前 是 否 抽烟 等 风险 因素 ， 
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FE 代 收 集 的 数据 估算 出 来 的 ,所 以 这 项 研究 的 隐 含 假定 














却 








JE, 


当前 人 群 中 的 其 他 人 口 特征 将 会 保持 不 变 。 然 而 , 吸烟 习惯 和 其 他 重要 的 
生活 因素 已 经 随 着 时 间 发 生 了 改变 。Cook 和 Ridker 估计 ， 在 这 项 纵向 研 


究 开 始 的 时 候 ， 人 口 群 体 〈 白 
人 口 群 体 中 只 有 不 到 20% 的 人 吸烟 ， 

















变 ， 并 且 有 可 能 因此 导致 人 们 过 高 地 估计 了 这 群 人 的 风险 级 别 。” 

我 们 经 常 谈 到 外 部 效 度 ， 它 指 的 是 一 个 发 现 能 否 被 外 推 到 研究 人 群 
以 外 的 人 群 中 去 (我们 将 在 第 7 章 深入 探讨 这 个 问题 )。 但 是 ， 还 有 一 种 
效 度 是 时 间 效 度 。 外 部 效 度 指 的 是 我 们 在 一 个 地 方 学 习 到 的 东西 如 何 告 诉 
我 们 另 一 个 地 方 将 要 发 生 的 事情 。 在 欧洲 进行 的 一 个 随机 对 照 实验 的 结论 
能 否 告诉 我 们 某 种 药物 在 美国 是 否 会 有 效 ? 随 着 时 间 的 变化 , 因果 关系 本 
身 也 可 能 会 发 生 改 变 (新 的 规章 制度 会 改变 影响 股票 价格 的 因素 )， 或 者 
因果 关系 的 强度 也 会 发 生 改 变 ( 如 果 大 多 数 人 都 在 网 上 看 新 闻 , 那么 印刷 
广告 对 人 们 的 影响 就 会 降低 ) 同样 ， 做 广告 的 人 可 能 会 分 析出 社交 网 络 























是 如 何 影响 人 们 的 购买 行为 的 , 但 如 果 人 们 使 用 社交 网 络 上 














人 和 群体) 中 有 33% 的 人 都 吸烟 ， 而 如 今 同 一 
”这 就 导致 风险 的 基线 水 平 发 生 了 改 






































的 方式 随 着 时 间 


发 生 了 改变 ， 那么 社交 网 络 和 购买 行为 之 间 的 关系 将 不 复 存在 ( 比如 人 
们 过 去 只 会 点 击 好 朋友 的 主页 链接 ,但 现在 会 点 击 很 多 泛泛 之 交 的 主页 
链接 )。 在 使 用 因果 关系 时 ， 人 们 会 默认 那些 让 因果 关系 成 立 的 因素 是 保 








持 不 变 的 。 
如 果 我 们 考 





a 

















察 随 着 时 间 的 变化 ， 某 个 医院 的 病人 再 人 院 率 ， 那 么 就 

















领导 层 变 更 之 日 起 ,病人 的 再 人 院 率 可 能 会 随 着 时 间 的 变化 而 增长 。 但 


这 也 可 能 是 因为 医院 服务 的 人 群 也 随 着 时 间 发 4 











可 能 会 出 现 一 个 与 之 类 似 的 情景 。 从 某 项 新 政策 实施 之 日 起 , 或 者 从 医院 


E 
FE » 


E 了 改变 , 现在 服务 的 人 群 
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的 健康 状况 比 以 前 更 差 了 。 实 际 上 ， 新 政策 本 身 可 能 也 改变 了 这 个 人 群 ， 
我 们 将 在 第 9 章 详细 讨论 这 个 问题 。 我 们 常常 试图 根据 因果 关系 来 制定 一 
些 政策 , 但 是 政策 本 身 可 能 也 会 改变 一 个 人 群 。 结 果 , 最 初 的 因果 关系 可 
能 已 经 不 复 存在 , 从 而 导致 干预 措施 失效 ， 比 如 加 州 学 校 缩 小 班级 规模 的 
项 目 。 在 这 个 项 目 中 , 对 教师 需求 的 激增 导致 学 校 招聘 了 一 批 经 验 不 足 的 
教师 群体 。 

这 时 也 有 可 能 会 出 现 新 的 因果 关系 ， 比 如 出 现 一 种 新 的 致癌 物 。 此 
外 ,变量 的 含义 也 可 能 会 发 生 改 变 。 语言 就 一 直 在 演变 , 新 的 词汇 不 断 涌 
现 ， 而 现 有 词汇 可 能 有 了 新 的 用 法 〈 比如 用 贬义 词 来 表达 讲义 )。 如 果 我 们 
发 现 政 治 演说 内 容 和 支持 率 之 间 存 在 相关 性 , 而 现在 能 赢得 支持 率 的 语言 
的 含义 发 生 了 改变 , 那么 这 种 相关 性 就 不 复 存 在 了 。 结 果 , 关于 支持 率 上 
升 的 预测 就 会 失败 , 而 发 表 新 演说 的 行为 可 能 也 不 会 有 什么 效果 了 。 在 一 
个 比较 短 的 时 间 尺 度 内 ,比如 每 天 都 有 新 的 变化 , 但 我 们 却 没有 考虑 到 这 
些 变化 ， 那 么 就 有 可 能 会 出 现 这 种 情况 。 

有 一 些 策略 可 以 用 来 处 理 这 些 不 稳定 的 时 间 序 列 。 虽 然 我 们 可 以 直 
接 忽 视 这 种 不 稳定 性 ， 但 还 有 一 些 更 好 的 方法 可 以 用 来 处 理 这 种 问题 。 
比如 , 在 数据 足够 多 的 情况 下 , 我 们 可 以 缩短 研究 周期 ( 如 果 时 间 序 列 的 
某 个 子 集 是 稳定 的 ), 或 者 把 一 个 不 稳定 的 时 间 序 列 变 成 一 个 稳定 的 时 间 
序列 。 

Elliot Sober 曾经 介绍 过 一 个 具有 不 稳定 性 的 例子 。” 这 个 例子 如 今 被 
广泛 使 用 , 它 讲 的 是 威尼斯 海平 面 和 英国 面包 价格 之 间 的 关系 。 它们 都 随 
着 时 间 的 变化 而 上 涨 了 ， 所 以 二 者 似乎 具有 相关 性 。 如 果 使 用 Sober 为 这 
个 例子 提供 的 数据 (如 图 4-4a 所 示 ， 注 意图 中 并 未 标 出 变量 的 单位 )， 那 
么 这 两 个 变量 之 间 的 皮尔 逊 相 关系 数 是 0.8204。 尽 管 这 两 个 时 间 序 列 都 一 
直 在 增加 , 但 这 两 个 变量 每 年 的 具体 增加 量 却 是 不 断 变 化 的 , 而 我 们 真正 
想 知道 的 是 这 些 变化 是 如 何 相互 关联 的 。 最 简单 的 方法 就 是 观察 这 两 个 变 
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量 的 具体 增加 量 , 而 不 是 那些 原始 的 数值 。 也 就 是 说 ,与 上 一 年 测量 的 数 
值 相 比 , 本 年 度 海 平面 或 面包 价格 上 涨 了 多 少 ? 如 果 我 们 使 用 年 度 之 间 的 
变化 值 (如 图 4-4b 所 示 )， 那 么 相关 系数 则 会 下 降 至 0.4714。 














年 度 年 度 
一 - 面包 -海平 面 一 - 面包 -= 海平 面 
(a) 原始 数据 (b) 变化 值 





图 4-4 面包 价格 与 海平 面 





























这 种 方法 叫 作 差分 法 (顾名思义 , 就 是 选取 连续 数据 点 之 间 的 差 量 )， 
它 是 实现 时 间 序 列 稳定 性 的 最 简单 方法 。 即便 两 个 时 间 序 列 旦 现 出 的 长 期 
趋势 是 一 样 的 ( 比如 一 直 在 上 涨 )， 但 如 果 每 天 或 每 年 的 变化 量 不 同 ， 那 
么 二 者 各 自 的 变化 值 可 能 也 不 再 具有 相关 性 。 一 般 来 说 ， 仅 仅 采 用 差分 
法 并 不 能 保证 转化 出 的 时 间 序 列 就 一 定 具 有 稳定 性 ， 要 想 实现 时 间 序 列 
的 稳定 性 ， 我 们 可 能 还 要 采取 更 为 复杂 的 数据 转换 措施 。” 
这 就 是 股市 数据 一 般 使 用 的 都 是 股票 收益 〈 价格 变化 ) 数据 而 不 是 
真实 价格 数据 的 原因 。 而 这 正 是 柠檬 进口 数量 和 公路 死亡 人 数 案例 问题 的 
症结 所 在 , 也 是 我 们 在 很 多 时 间 序 列 组 中 找到 类 似 关系 的 原因 所 在 。 如 果 
总 体 趋势 相似 并 且 具 有 显著 性 , 那么 这 种 趋势 就 会 对 相关 性 系数 产生 极 大 
的 影响 , 从 而 掩盖 了 短 周 期 中 两 个 变量 的 变化 量 ( 这 些 变化 量 之 间 可 能 根 
本 不 存在 相关 性 ) 之 间 存 在 的 差异 。” 
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44 原因 运用 中 的 时 间 因 素 











一 周 中 的 哪 一 天 最 适合 订 机 票 ? 应 该 早上 锻炼 还 是 晚上 锻炼 ? 我 们 
该 等 多 久 才 能 要 求 加 薪 ? 经 济 学 家 们 经 常 谈论 季节 效 应， 这些 季节 效应 
是 每 年 同一 时 间 都 会 出 现 的 规律 ， 是 一 种 不 稳定 性 特征 ， 但 是 在 很 多 其 


他 类 型 的 时 间 序 列 



































， 比 如 看 电影 的 人 数 〈 受 到 季节 和 节假日 的 影响 ) 


和 急诊 室 病人 的 数量 ( 可 能 会 因为 季节 性 疾病 而 剧 增 ), 我 们 也 能 发 现 一 


些 与 时 间 有 关 的 规律 。 假 如 我 
涨 的 因素 ， 那 么 这 些 因素 在 夏季 也 六 
规律 可 能 只 在 一 周 中 的 某 一 天 才 会 出 现 ( 比如 由 上 下 班 的 习惯 导致 的 一 
些 规律 )， 或 者 








察 到 一 个 人 先生 病 , 然 











门 在 冬季 发 现 了 一 些 能 够 让 电影 票 销量 上 
F 就 不 会 起 到 预期 的 效果 。 还 有 一 些 























是 公共 节假日 的 安排 导致 的 。 
事件 发 生 的 顺序 可 能 会 帮助 我 们 把 握 事件 发 生 的 原因 ( 如 果 我 们 观 





导致 这 个 人 生病 的 








但 要 想 有 效 地 运用 




















后 体重 才 下 降 , 那么 我 们 就 知道 体重 下 降 不 可 能 是 
原因 ) 并 做 出 更 好 的 预测 ( 知道 某 种 结果 出 现 的 时 间 )。 

















原因 , 我 们 需要 知道 的 就 不 只 是 事件 发 生 的 顺序 了 。 首 

















先 需 要 知道 某 个 关系 是 否 只 在 有 些 情况 下 成 立 , 还 要 知道 原因 和 结果 之 间 
的 时 间 间 隔 是 多 久 。 





因此 ， 收 集 六 











u 








F 标 明 时 间 信 息 至 关 重要 。 及 时 采取 治疗 措施 能 提高 很 

















多 疾病 ( 比如 中 风 ) 的 治疗 效果 , 但 是 治疗 效果 并 不 总 是 随 着 治疗 时 间 的 





























疗 ， 那 么 效果 会 更 好 。 但 是 ， 如 果 在 5 





推迟 而 直线 下 降 。 比 如 有 报道 称 , 如 果 我 们 在 川崎 病症 状 出 现 后 的 10 天 内 
开始 治疗 ,将 大 大 降低 病人 冠状 动脉 受 损 的 风险 。 如 果 在 7 天 之 内 开始 治 





天 之 内 开始 治疗 ， 治 疗效 果 并 不 会 














Hip 











些 情 况 下 ， 早 上 用 



































药 还 是 晚上 用 药 也 可 能 改变 药物 的 





治疗 效果 。 因 此 ， 如 果菜 种 药物 在 临床 试验 中 有 特定 的 服药 时 间 ， 或 者 每 





天 服药 的 时 间 都 是 一 样 的 ， 但 是 在 非 临 


























床 试验 的 实际 使 用 中 ， 每 天 服药 的 




















时 间 变 化 很 大 ， 那 么 这 个 药物 的 药 效 可 能 并 没有 临床 试验 预测 得 那么 好 。 
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为 了 确定 采取 行动 的 时 间 ， 我 们 还 要 知道 一 个 原因 需要 多 久 才能 





生 某 种 结果 。 这 可 能 意味 着 我 们 在 选举 之 前 要 确定 什么 时 候 投 放 某 些 广 











告 , 在 收 到 一 条 信息 后 要 确定 什么 时 候 卖 掉 某 个 股票 , 或 者 在 出 行 之 前 要 








Eni 











间 太 早 

















定 什 么 时 候 开 始 服 用 抗 症 疾 药 物 。 在 有 些 情 况 下 , 如果 我 们 采取 的 措施 
没有 考虑 到 时 间 因 素 , 那 它 们 可 能 不 会 产生 任何 效果 。 比 如 广告 投放 的 时 














(后 来 出 现 的 其 他 原因 可 能 会 干预 广告 效果 )、 股 票 价格 还 没有 到 











达 峰 值 就 做 出 交易 决定 , 或 者 开始 服用 预防 性 药物 的 时 间 不 够 早 , 无 法 起 
到 保护 作用 。 




















时 间 还 可 能 会 影响 我 们 是 否 采取 行动 的 决策 ， 因 为 它 会 影响 我 们 对 


一 个 原因 的 效用 和 潜在 风险 的 判断 。 原 因 的 效用 既 取 决 于 某 个 结果 出 现 的 











概率 ( 在 其 他 条 件 不 变 的 情况 下 , 成 功率 为 90% 的 原因 比 成 功率 为 10% 的 











原因 要 更 好 )， 又 取决 于 出 现 这 个 结果 所 需 的 时 间 。 人 们 都 知道 吸烟 会 导 
致 肺 瘤 和 心血 管 疾病 ， 但 是 这 些 疾 病 并 不 会 在 吸烟 之 后 就 立即 出 现 。 仅 
和 赁 癌症 出 现 的 概率 并 不 足以 让 我 们 清楚 地 认识 到 吸烟 的 风险 ， 我 们 还 需 
要 知道 时 间 信 息 。 对 于 某 些 人 来 说 , 在 不 久 的 将 来 可 能 会 患 某 种 疾病 的 风 





险 很 小 ， 
更 大 。 


























但 与 在 遥远 的 未 来 几乎 一 定 会 患 某 种 疾病 相 比 , 前 者 的 风险 似乎 








然而 ， 在 干预 措施 的 决策 过 程 中 ， 我 们 不 仅 要 决定 是 否 要 采用 某 种 
措施 来 取得 某 种 结果 ， 更 重要 的 是 要 决定 到 底 采 用 哪 一 种 干预 措施 。 


(RKE 














传 》 中 有 这 样 一 个 情节 ，Jerry 在 研究 各 种 治疗 感冒 的 药物 ， 他 


自 言 自 语 着 :“ 这 个 药 见 效 快 ， 但 是 这 个 药 效 长 。 什 么 时 候 减 轻 症状 对 
我 来 说 最 重要 呢 ， 是 现在 还 是 迟 些 时 候 ? ”” 尽 管 这 个 信息 增加 了 决策 
过 程 的 复杂 性 ， 但 它 却 能 够 让 我 们 根据 其 他 限制 条 件 〈 比如 一 个 小 时 后 


Ai 




















要 的 会 议 与 要 上 一 整 天 的 课 ) 做 出 更 好 的 决策 , 从 而 规划 我 们 的 





行为 。 
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4.5 时 间 可 能 具有 误导 性 




















时 间 是 能 够 让 我 们 将 因果 关系 从 相关 性 中 区 分 出 来 的 重要 特征 之 
一 。 我 们 假定 相关 性 存在 时 ， 只 有 首先 出 现 的 事件 才 可 能 是 原因 。 然 而 ， 
由 于 事件 发 生 的 顺序 如 此 重要 , 我 们 反而 有 可 能 在 确立 因果 关系 的 过 程 中 
过 于 依赖 事件 发 生 的 顺序 。 

假设 某 个 学 校 的 餐厅 决定 减少 油 炸 食品 和 高 热量 食品 的 供应 量 ， 增 
加 水 果 、 蔬 菜 和 全 谷物 食品 的 供应 量 。 自 从 这 一 措施 实施 后 , 学 校 学 生 的 
体重 每 个 月 都 在 下 降 。 图 4-5 展示 的 是 学 生平 均 体重 (一 半 学 生 的 体重 高 
于 平均 水 平 , 一 半 学 生 的 体重 低 于 平均 水 平 ) 随 着 时 间 而 变化 的 一 个 虚构 
出 来 的 例子 。 图 中 显示 , 在 学 校 餐 厅 调 整 菜单 之 后 , 学 生 的 平均 体重 骤然 
下 降 , 而 且 这 一 下 降 趋 势 维持 了 好 几 个 月 。 这 是 否 意味 着 学 校 供应 更 健康 
的 食物 导致 学 生体 重 下 降 了 呢 ? 














































































































调整 菜单 





时 间 
图 4-5 变量 随 着 时 间 而 变化 的 值 。 调 整 菜单 之 后 ， 变 量 的 数值 下 降 了 











某 个 事件 发 生 后 ， 一 个 变量 的 值 发 生 了 明显 的 变化 ， 这 样 的 数据 常 
被 用 来 证 明 上 述 类 型 的 观点 。 但 是 ,这 样 的 数据 其 实 并 不 能 证 明 这 种 观点 。 
这 样 的 例子 有 很 多 ,比如 某 项 法 律 的 倡导 者 指出 , 在 这 项 法 律 实施 后 死亡 
率 下 降 了 ; 有 人 认为 某 种 药物 导致 了 一 种 副作用 , 因为 这 种 副作用 是 在 他 
开始 服用 这 种 药物 的 几 天 后 出 现 的 。 















































94 ， 别 拿 相关 当 因果 ! 因果 关系 简易 入 门 















































在 调整 菜单 的 那个 案例 中 ， 我 们 并 不 清楚 调整 菜单 前 后 在 餐厅 就 餐 











的 是 否 是 同一 批 学 生 ( 也 许 那些 喜欢 吃 健康 食品 的 学 生 在 调整 菜单 后 转 而 








开始 在 餐厅 吃饭 ， 而 那些 不 喜欢 新 菜单 的 学 生 则 不 表 














去 餐厅 吃饭 了 ), 或 











者 餐厅 调整 菜单 是 否 是 学 生 或 家 长 的 要 求 〈 因 为 他 们 正在 减肥 )， 又 或 者 











是 否 还 有 其 他 变化 共同 导致 了 这 个 结果 ( 也 许 同时 还 增加 了 体育 活动 和 休 
息 时 间 )。 只 有 一 个 因素 发 生 改 变 ， 其 他 因素 完全 不 变 ， 这 样 的 情况 即便 


有 ， 也 极为 稀少 。 所 以 ， 只 有 两 个 变量 的 时 间 序 列 会 让 人 产生 一 种 错觉 ， 








认为 可 以 将 某 个 新 变量 的 影响 完全 从 其 他 因素 的 影 
是 一 种 时 间 上 的 相关 性 ， 但 也 依然 只 是 相关 性 而 已 。 








啊 中 分 离 出 来 。 尽 管 这 





现实 生活 中 的 干预 措施 比 实 验 室 的 实验 更 为 复杂 ， 也 更 加 不 明确 。 





























比如 说 , 某 个 区 域 有 一 家 工厂 ， 人 们 怀疑 这 个 区 域 是 癌症 高 发 区 。 最 终 工 


TERA, 人 们 也 采取 了 一 些 措施 来 恢复 被 污染 的 水 和 土壤 。 如 果 癌 证 发 
病 率 在 工厂 关闭 后 下 降 了 , 我 们 能 否 因此 认为 这 个 工厂 是 导致 癌症 高 发 的 
原因 呢 ? 实 际 上 ， 我 们 并 不 清楚 癌症 发 病 率 下 降 是 否 只 是 一 个 偶然 事件 























(或 者 一 开始 的 癌症 高 发 也 只 是 一 个 偶然 事件 ), 也 不 清楚 当时 是 否 还 有 其 
他 真正 导致 癌症 高 发 的 因素 ,很 多 问题 的 答案 都 是 未 知 的 。 此 外 , 这 些 变 















































量 的 值 通常 都 很 小 所以， 它们 的 任何 变化 在 统计 学 上 都 不 具有 显著 性 。 














“在 此 之 后 ,因而 必然 由 此 造成 ”。 也 就 是 说 ， 人 们 仅仅 因为 一 件 事情 在 









































一 件 事情 之 后 发 生 ， 就 错误 地 认为 后 发 生 的 事情 是 





1 先 发 生 的 事情 











的 。 比 如 说 ,人们 可 能 会 研究 在 某 个 特定 的 历史 事 伯 








生 的 概率 是 如 何 变 化 的 
































F 发 生 后 ， 某 些 事件 发 
引入 安全 市 法 律 后 , 交通 


事故 的 死亡 率 下 降 了 














吗 ? 然而 , 有 很 多 变化 是 同时 发 生 的 ,而 系统 本 吴 





IJ 


至 也 可 能 会 由 于 干预 


措施 的 实施 而 发 生 改变 ( 这 一 点 我 们 将 在 第 7 章 进 一 步 讨论 ),。 但 是 ,也 
许 更 健康 的 餐厅 食物 只 是 通过 促使 人 们 增加 运动 量 而 间接 导致 了 体重 的 




















下 降 。 同 样 ， 如 果 一 个 体 工 队 每 次 只 要 比赛 前 下 雨 就 能 打 赢 比 赛 , 那么 人 
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们 有 可 能 由 此 认为 这 两 者 之 间 存 在 因果 关系 , 但 其 实 这 种 现象 最 合理 的 解 














释 就 是 巧合 。 如 果 我 们 总 是 上 




















J 着 短期 发 生 的 事情 而 忽视 长 期 的 变化 , 那么 





























这 种 问题 就 会 经 常 出 现 。 如 果 连 续 两 年 冬季 都 出 现 了 极端 的 暴雪 大气, 那 
么 将 这 两 个 冬季 孤立 起 来 看 ， 





我 们 就 有 可 能 得 出 错误 的 冬季 天 气 规律 。 相 





反 , 如 果 我 们 考察 了 几 十 年 

















9 天气 数 据 , 就 能 在 大 趋势 背景 下 了 解 到 每 年 





的 天 气 波动 。 两 个 事件 之 所 以 会 一 起 发 生 , 可 能 只 是 因为 其 他 因素 让 它们 
一 起 发 生 的 可 能 性 增加 了 。 如果 某 种 儿童 疾病 会 在 某 个 年 龄 开始 出 现 明显 
特征 , 而 这 些 儿童 在 同一 年 龄 开始 吃 一 些 新 的 食物 , 那么 很 多 人 可 能 会 因 
为 这 两 件 事情 总 是 一 起 发 生 而 认为 二 者 之 间 存 在 某 种 表面 联系 。 

还 有 一 个 相关 的 逻辑 雇 论 , 叫 作 “ 随 此 , 所 以 因此 ”( 与 此 同时 发 生 ， 
因而 必然 由 此 造成 )， 它 指 的 是 在 两 个 仅仅 同时 发 生 的 事件 之 间 找 到 某 种 









































因果 关系 。 这 个 刻 论 与 “后 此 ” 诬 论 之 间 的 区 别 是 :“ 后 此 ” 诸 论 涉及 和 事 
件 发 生 的 先后 顺序 ， 而 这 也 正 是 这 种 错误 如 此 普遍 的 原因 。 
先 发 生 的 事件 和 最 终 的 结果 可 能 是 由 一 个 共同 的 原因 导致 的 。( 比 

































































如 , 治疗 抑郁 症 的 药物 会 让 人 有 自杀 倾向 吗 , 还 是 说 患 抑 郁 症 的 人 往往 更 容 
易 自杀 ， 也 更 容易 服用 治疗 抑郁 症 的 药物 ? ) 但 这 个 结果 的 出 现 可 能 是 必然 






































的 ， 只 不 过 是 出 现在 了 原因 之 后 而 已 。 假 如 某 个 人 头疼 ， 然 后 吃 了 一 些 药 ， 


几 个 小 时 后 头 不 疼 了 ,我们 是 





否 可 以 说 这 是 因为 服药 的 缘故 呢 ? 这 两 个 事件 


























发 生 的 时 间 让 我 们 觉得 头 不 疼 了 好 像 是 吃 药 的 结果 , 但 我 们 无 法 肯定 如 果 不 


吃 药 的 话 ， 头疼 是 否 也 会 好 起 来 。 为 此 ,我 们 需要 做 很 多 实验 ， 随 机 选择 是 














吃 药 还 是 不 吃 药 ， 并 记录 下 头疼 减轻 的 速度 ， 只 有 这 样 才 能 说 吃 药 和 头疼 




















之 间 是 否 存 在 某 种 关系 ,第 7 


之 间 的 关系 ， 以 及 为 什么 我 们 应 该 对 比 吃 药 的 效果 和 吃 安慰 剂 的 效果 。 


章 将 会 解释 为 什么 这 一 实验 还 不 足以 证 明 二 者 





























两 个 事件 在 时 间 上 的 相近 性 可 能 会 导致 人 们 得 出 错误 的 因果 结论 。 
同样 , 因果 事件 之 间 漫 长 的 时 间 间 隔 也 可 能 会 导致 人 们 无 法 推理 出 二 者 之 
间 的 因果 联系 。 有 些 结果 很 快 就 会 发 生 ( 比如 台球 被 击 中 后 就 会 立即 开始 
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别 拿 相关 当 因 果 ! 因果 关系 简易 入 门 








运动 )， 还 有 一 些 结果 可 能 要 经 过 一 个 缓慢 的 作用 过 程 才 会 发 生 。 大 家 
知道 吸烟 会 导致 肺癌 ,但 从 某 人 开始 吸烟 到 他 得 肺癌 之 间 有 一 个 漫长 的 


间 间 隔 。 





























逐渐 改善 健康 状况 。 但 如 果 我 们 关注 的 是 体重 , 那 就 会 发 现 一 开始 锻炼 
体重 似乎 还 会 上 升 。 因 为 刚 开始 运动 时 ,人 的 脂肪 还 未 减少 但 肌肉 却 开始 


增多 了 。 如 果 我 们 认为 结 明 
































都 
时 


有 些 药物 的 副作用 在 服药 几 十 年 之 后 才 会 出 现 , 锻炼 会 随 着 时 间 


时 


会 紧 随 原因 出 现 , 那 就 有 可 能 无 法 找到 那些 真 


正 相关 的 因素 之 间 的 联系 。 从 统计 学 上 来 说 , 科学 家 很 难 收集 周期 长 达 几 


十 年 的 数据 来 了 解 影响 健康 的 因素 。 对 于 个 人 来 说 , 我 们 也 很 难 将 饮食 








体育 活动 这 样 的 因素 和 我 们 的 健康 联系 起 来 。 
注释 


1. 


Leibovici (2001 )。 对 这 篇 文章 的 评论 刊载 在 BMJ 杂志 2007 4E 4 H 27 


出 版 的 那 一 期 上 。 

















.这 种 非 对 称 性 的 男 一 个 可 能 的 定义 是 : 对 原因 进行 干预 会 改变 结果 ， 而 
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结果 进行 干预 却 不 会 对 原因 产生 任何 影响 。 然 而 ， 这 一 定义 也 存在 其 他 一 
些 问 题 。 因 为 我 们 通常 无 法 对 原因 或 结果 进行 干预 ， 或 者 说 我 们 在 对 原 
或 结果 进行 干预 时 ， 无 法 让 其 他 所 有 变量 保持 不 变 。 





. Michotte ( 1946 )。 
. 想 要 了 解 更 多 信息 ， 参 见 Joynson (1971 )。 
. Michotte (1946), 69, 166, x4 











出 使 用 每 一 种 描述 的 人 数 。 


. Michotte ( 1946 )，63。 
， 在 早期 的 研究 中 ，Heider 和 Simmel ( 1944 ) 使 用 更 加 复杂 的 动作 制作 了 
































P 并 未 给 出 研究 对 象 的 准确 描述 ， 也 未 
































个 相似 并 且 更 长 的 视频 。 在 没有 任何 提示 的 情况 下 ， 所 有 参与 者 都 使 
发 生 的 事件 。 虽 然 视频 中 的 物体 只 是 一 些 
角形 和 圆 形 ， 但 参与 者 却 将 它们 描述 成 了 具有 不 同意 图 的 生命 体 ， 而 且 这 
些 生命 体 正 在 进行 各 种 活动 ， 比 如 战斗 和 追逐 。 
. Michotte ( 1946 )，249，347。 

.在 Beasley (1968) 的 研究 中 ， 
果 关 系 的 ， 而 在 Gemelli 和 Cappellini (1958) 的 研究 中 ， 有 87% 的 参与 者 








述 生命 体 的 方式 来 描述 视频 
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64% 的 参与 者 认为 这 些 动作 之 间 是 有 














认为 这 些 动作 之 间 是 有 因果 关系 的 。 
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] 描 
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第 S 瘟 ”观察 法 


如 何 仅 通过 观察 事物 的 运行 方式 
来 把 握 事件 发 生 的 原因 ? 


有 一 天 下 班 , 我 在 地 铁 上 看 到 一 则 广告 。 广 告 上 这 样 写 道 :“ 如 果 你 高 
中 毕业 了 , 找到 了 一 份 工 作 , 并 且 婚 后 才 生 的 孩子 , 那么 你 98% 不 会 穷困 
渡 倒 。 ”这 则 广告 的 目的 是 呼吁 十 几 岁 的 女孩 不 要 早孕 ， 但 我 们 并 不 清楚 
该 如 何 理解 这 个 统计 数据 。 这 人 句 话 的 意思 似乎 是 , 如 果 一 个 年 轻 女孩 能 
按照 广告 上 说 的 那样 做 , 那么 她 98% 不 会 穷困 流 倒 。 但 是 , 事实 真 的 是 这 
样 吗 ? 而 且 这 句 话 是 说 她 现在 不 会 处 于 穷困 深 倒 的 境地 , 还 是 永远 都 不 会 
处 于 穷困 渡 倒 的 境地 呢 ? 这 个 数据 是 从 一 项 研究 中 得 出 的 , 这 项 研究 考察 
了 不 同 婚姻 状况 、 年 龄 和 教育 水 平等 特征 的 人 口 , 计算 了 总 的 贫困 人 口 比 
例 以 及 各 个 人 群 中 贫困 人 口 所 占 的 比例 。 但是， 统计 结果 完全 建立 在 观 
察 到 的 数据 的 基础 之 上 。 

没有 任何 ( 个 人 或 社会 的 ) 政策 能 强制 年 轻 女孩 怀孕 或 者 不 怀孕 ， 
也 没有 任何 政策 能 迫使 她 们 穷困 或 者 不 穷困 。 这 就 意味 着 这 个 数据 只 统计 
了 我 们 观察 到 的 一 部 分 人 口中 的 一 个 特征 : 在 我 们 观察 到 的 高 中 毕业 、 找 
到 工作 并 且 婚 后 才 生 孩子 的 人 口中 , 有 98% 的 人 并 未 穷困 流 倒 。 但 如 果 具 
体 到 某 一 个 人 , 她 高 中 毕业 ,找到 了 一 份 工作 并 且 婚 后 才 生 的 孩子 , 那么 
她 贫困 渡 倒 的 概率 可 能 和 统计 数据 并 不 一 样 。 这 一 点 类 似 于 第 1 章 讨 论 的 
































































































































SIDS 案例 。 在 那个 案例 中 , 我 们 发 现任 意 一 个 家 庭 的 孩子 患 上 SIDS 的 概 
率 和 具体 某 个 家 庭 的 孩子 患 上 SIDS 的 概率 是 不 一 样 的 。 

而 且 ， 有 些 人 没有 完成 学 业 的 原因 可 能 也 正 是 导致 他 们 贫困 该 倒 的 
原因 ， 并 且 这 些 原因 是 他 们 不 可 控 的 。 也 许 他 们 不 得 不 照看 家 里 的 老人 ， 
也 许 他 们 缺少 生活 保障 〈 比如 医疗 保障 ) 或 家 人 的 支持 。 这 就 意味 着 他 
们 可 能 无 法 只 是 简单 地 去 寻找 一 份 工作 , 而 且 不 得 不 去 解决 其 他 问题 ( 比 
如 为 父亲 或 母亲 另 找 一 个 护 工 ) 而 且 ， 如 果 这 些 其 他 因素 ( 比如 高 额 的 
医疗 费用 ) 才 是 最 终 导致 贫穷 的 原因 ， 那 么 即便 满足 了 上 述 三 个 标准 ， 
他 们 陷入 贫困 境地 的 风险 也 不 会 改变 。 如 果 未 完成 学 业 、 找 不 到 工作 和 
婚前 生子 只 是 那个 导致 人 们 隐 入 贫困 境地 的 因素 所 带 来 的 其 他 影响 ， 那 
么 针对 这 些 问 题 采取 干预 措施 就 像 在 处 理事 情 的 结果 而 不 是 起 因 。 贫 穷 
可 能 是 情境 因素 引起 的 ， 而 且 这 些 情 境 因 素 是 很 难 干 预 的 ， 比 如 歧视 、 
工作 机 会 荐 乏 或 者 教育 水 平 低下 等 。 

这 对 公共 政策 的 制定 有 着 巨大 的 影响 。 如 果 我 们 只 致力 于 提升 人 们 
受 教 育 的 机 会 和 就 业 机 会 , 却 不 知道 是 什么 因素 导致 人 们 无 法 获得 这 两 个 
机 会 , 也 不 知道 这 两 者 本 身 是 否 就 是 导致 贫困 的 原因 , 那么 我 们 就 更 难 制 
定 有 效 的 干预 措施 了 。 我 们 不 知道 是 否 还 有 其 他 问题 导致 我 们 无 法 实现 经 
济 保障 ， 也 不 知道 我 们 所 采取 的 措施 能 否 给 我 们 带 来 想 要 的 结果 。 此 外 ， 
所 有 这 些 因素 都 有 可 能 是 贫穷 导致 的 结果 ， 我 们 也 许 应 该 通过 新 的 方式 来 
直接 解决 贫穷 问题 。 ”我 们 将 在 第 7 章 和 第 9 章 详细 介绍 如 何 采取 干预 措 
施 才 能 取得 预想 的 效果 , 以 及 我 们 需要 哪些 信息 才能 预测 出 某 个 干预 措施 
的 效果 。 

如 果 我 们 能 够 强迫 一 些 人 读 完 高 中 〈 或 者 不 读 完 )， 然 后 将 他 们 随机 
分 配 到 这 些 不 同 的 实验 组 中 ( 避免 他 们 出 现 其 他 情况 )， 就 有 可 能 将 这 一 
行为 对 未 来 经 济 形势 的 影响 分 离 出 来 。 但 实际 情况 是 , 我 们 所 观察 到 的 数 
据 往 往 是 我 们 所 能 获得 的 全 部 信息 。 如果 为 了 考察 年 轻 女 孩 怀孕 是 否 是 贫 
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穷 导致 的 结果 或 引起 贫穷 


了 的 原因 ( 或 者 是 否 存在 一 个 反 
些 实验 , 那么 这 种 行为 是 不 道德 的 。 研 究 人 员 还 需要 确定 接触 某 些 媒 
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控制 人 们 接触 媒体 的 行为 ,甚至 无 法 有 
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定 某 个 人 是 否 接触 过 某 个 媒体 。 研 
总 体 特 征 一 一 在 某 个 地 区 投放 某 个 广告 
测验 结果 与 其 他 地 区 相 比 发 生 了 什么 变 


























化 。 我 们 可 能 无 法 在 一 个 很 长 的 时 间 周 
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研究 精力 ， 但 这 是 研究 活动 中 的 4 











本 章 讨论 的 内 容 是 ， 当 我 们 只 能 





期 内 追踪 参与 者 的 行为 , 即便 可 以 
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竺 例 而 不 是 惯例 。 
观察 正在 发 生 的 情况 时 ， 如 何 去 发 





现 事 物 的 运行 方式 。 我们 还 将 讨论 这 


存在 的 一 些 局 限 性 。 


5.1 规律 性 


5.1.1 称 勒 五 法 
假设 一 群 计算 机 科学 家 参加 
忙 到 凌晨 ， 
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是 , 在 第 二 天 的 颁奖 典礼 上 ， 他 人 
样 才能 确定 是 
有 些 团体 中 出 现 了 某 种 结 
种 情况 , 试图 找 出 这 些 团 
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些 方法 的 局 限 性 , 以 及 观察 数据 通常 














了 一 个 编程 马拉松 。 这 些 科学 家 们 每 天 





营养 均衡 和 饮食 健康 对 他 们 来 说 简直 就 是 天 方 夜 谭 , 所 以 很 
多 人 在 效 夜 时 都 是 依靠 浓 咖 啡 、 比 萨 饼 和 功 和 角 
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而 男 一 些 团体 中 没有 出 现 某 种 结果 ， 针 
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在 19 世纪 提出 的 穆 勒 五 法 的 典型 用 途 之 一 ( 其 中 涉及 食物 中 毒 的 案例 似 
PEHEZ )。“ 
首先 可 以 想 一 想 : 所 有 出 现 某 种 结果 的 案例 之 间 有 什么 共同 点 ? 如 
果 在 所 有 头疼 的 案例 中 ， 唯 一 的 共同 点 就 是 人 们 都 喝 了 功能 性 饮料 ， 那 
么 这 就 在 一 定 程度 上 证 明了 功能 性 饮料 可 能 会 导致 头疼 。 这 就 是 穆 勒 所 说 
的 契合 法 。 在 表 5-1 所 示 的 例子 中 ,我 们 只 对 头疼 的 案例 感 兴趣 ， 所 以 只 
看 表 中 出 现 头疼 症状 的 那 几 行 数据 。 先 来 看 看 哪些 案例 中 出 现 了 头疼 的 证 
状 ， 然 后 再 来 看 这 些 案例 都 有 什么 共同 特征 。 我 们 注意 到 ,， 这些 案例 唯一 
的 共同 之 处 在 于 他 们 都 喝 了 功能 性 饮料 , 所 以 根据 契合 法 ,功能 性 饮料 就 
是 导致 他 们 出 现 头疼 的 原因 。 
合 是 指 某 个 原因 是 导致 某 种 结果 的 必要 条 件 一 一 除非 出 现 这 个 原 
因 ， 否则 不 会 出 现 这 种 结果 。 然 而 , 这 并 不 意味 着 这 个 原因 每 次 都 会 导致 
这 种 结果 。 如 果 那 样 的 话 ， 这 个 原因 就 成 了 出 现 这 种 结果 的 充分 条 件 。” 
在 表 5-1 F, Betty 也 喝 了 功能 性 饮料 ， 但 是 她 却 没 有 出 现 头疼 的 症状 。 
因此 , 我 们 不 能 说 喝 功能 性 饮料 是 出 现 头疼 症状 的 充分 条 件 , 只 能 说 这 些 
条 件 对 于 我 们 观察 到 的 内 容 来 说 是 真实 的 。 我 们 永远 无 法 从 有 限 的 样本 中 
去 证 实 必要 条 件 或 充分 条 件 。 























































































































表 5-1 根据 穆 勒 的 契合 法 ， 我 们 发 现 喝 功能 性 饮料 会 导致 头疼 





咖啡 比萨 饼 熬夜 功能 性 饮料 KE 
Alan x X X X 是 
Betty X X X T 
Carl X X 是 
Diane x x 是 


























这 种 方法 有 一 个 局 限 性 : 它 要 求 每 一 个 案例 都 是 一 致 的 。 如 果 有 几 
百 个 人 都 生病 了 ,只 有 一 个 人 没 生病 ,那么 我 们 也 无 法 找 出 某 种 因果 关系 。 
值得 注意 的 是 ， 这 个 方法 没有 考虑 到 Betty 也 喝 了 功能 性 饮料 却 没有 出 现 
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头疼 的 情况 。 这 就 是 这 个 方法 只 能 让 我 们 找到 必要 条 件 而 不 能 找到 充分 条 
件 的 原因 一 一 它 没有 包含 出 现 了 某 个 原因 却 没有 出 现 某 种 结果 的 情况 。 
要 想 确 定 充分 条 件 ， 我 们 就 要 考察 出 现 某 种 结果 和 未 出 现 某 种 结果 
的 情况 有 什么 差别 。 如 果 所 有 效 夜 的 人 第 二 天 都 很 疲惫 ,而 那 几 个 没有 效 
夜 的 人 第 二 天 都 很 精神 , 那么 我 们 就 会 发 现 熬 夜 是 第 二 天 很 疲惫 的 一 个 充 
分 条 件 〈 在 本 例 中 )。 这 就 是 穆 勒 的 差异 法 。 
ER 5-2 中 ,我们 对 比 了 疲劳 案例 和 非 疫 劳 案例 之 间 的 差异 。 注 意 ， 
在 所 有 疲劳 案例 中 , 四 个 因素 的 情况 都 是 一 样 的 , 所 以 我 们 无 法 使 用 契合 
法 来 确定 其 中 一 个 因素 就 是 导致 疲劳 的 原因 。 通 过 考察 这 些 案例 的 差异 ， 
我 们 看 到 熬夜 似乎 是 出 现 疲劳 状况 和 未 出 现 疲劳 状况 的 唯一 差异 。 与 契合 
法 一 样 ,这 个 条 件 相当 严格 。 因 为 有 可 能 会 碰巧 出 现 一 些 情况 : 即便 熬夜 
仍然 是 导致 疲劳 的 原因 , 但 其 他 因素 的 情况 却 可 能 不 尽 相同 。 我 们 将 在 下 
一 节 介绍 概率 法 , 这 种 方法 使 用 的 是 事件 出 现 的 相对 频率 , 它 对 关系 的 要 
求 没有 这 么 严格 。 









































































































































表 5-2 ”通过 穆 勒 的 差异 法 ， 我 们 发 现 熬 夜 会 导致 疲劳 





咖啡 比萨 饼 熬夜 功能 性 饮料 疲劳 
Ethan X X X X 是 
Fran X X X x 是 
Greg X X X 否 
Hank X X X X 是 





概括 一 下 ， 如 果 没 有 某 个 原因 ， 某 个 结果 就 不 会 出 现 〈 即 每 次 出 现 
这 个 结果 之 前 都 会 出 现 这 个 原因 ), 那么 这 个 原因 就 是 这 个 结果 的 必要 条 
件 ; 如 果 每 次 只 要 出 现 某 个 原因 ， 就 一 定 会 出 现 某 个 结果 ( 每 次 某 个 原因 
出 现 之 后 必然 伴随 某 个 结果 ), 那么 这 个 原因 就 是 这 个 结果 的 充分 条 件 。 某 
个 原因 可 能 是 必要 条 件 但 不 是 充分 条 件 , 反之 亦 然 。 在 编程 马拉松 的 案例 
中 , 每 次 出 现 疲劳 状况 时 ,之 前 必然 熬夜 了 ,这 样 熬夜 就 成 了 出 现 疫 劳 状 
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况 的 必要 条 件 。 但 是 ,这 并 没有 说 明 效 夜 就 是 出 现 疲劳 状况 的 充分 条 件 ( 有 
可 能 有 些 人 熬 了 夜 却 不 疲劳 ) 同样 ， 每 次 喝 了 功能 性 饮料 之 后 都 会 出 现 
头疼 症状 ,这 就 说 明 喝 功能 性 饮料 是 出 现 头 疼 症 状 的 充分 条 件 , 却 没有 说 
明 喝 功能 性 饮料 是 否 是 头疼 的 必要 条 件 ( 因为 可 能 还 存在 其 他 导致 头疼 的 
因素 )。 

还 有 一 些 原 因 可 能 是 某 个 结果 的 充分 必要 条 件 ( 如 表 5-3 所 示 )。 为 
了 找 出 那些 既是 充分 条 件 也 是 必要 条 件 的 原因 , 我 们 将 契合 法 和 差异 法 结 
合 起 来 使 用 , 这 就 是 称 勒 的 契合 差异 并 用 法 。 在 这 种 情况 下 , 我 们 要 找 的 
是 那些 每 次 出 现 某 种 结果 时 都 会 出 现 的 因素 , 并 且 只 有 在 出 现 这 种 结果 时 
才 会 出 现 这 些 因素 。 在 表 5-3 所 示 的 例子 中 ， 两 个 肚子 疼 的 人 都 熬夜 了 ， 
由 都 喝 了 咖啡 。 所 以 根据 契合 法 ， 这 两 个 因素 可 能 是 导致 肚子 疼 的 原因 。 
现在 ， 我 们 再 来 考察 一 下 这 两 个 因素 在 那些 肚子 不 疼 的 人 和 肚子 疼 的 人 
身上 有 什么 差别 。 我 们 发 现 ，Diane 熬夜 了 ， 但 没有 出 现 肚子 疼 的 症状 。 
所 以 熬夜 并 不 满足 差异 法 的 要 求 , 而 喝 咖 啡 却 满足 这 一 要 求 , 因为 所 有 喝 
了 很 多 咖啡 的 人 都 出 现 了 肚子 疼 的 症状 ， 而 没有 喝 咖 啡 的 人 都 没有 出 现 
这 一 证 状 。 因 此 , 根据 这 个 表格 的 数据 来 看 ， 喝 咖啡 是 肚子 疼 的 充分 必要 
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表 5-3 ”根据 穆 勒 的 契合 差异 并 用 法 ， 我 们 发 现 喝 咖啡 是 导致 肚子 疼 的 原因 





咖啡 比萨 饼 熬夜 功能 性 饮料 ALF 
Alan X X X X 是 
Betty X X 是 
Carl X X 否 
Diane X X T 


这 个 方法 存在 的 问题 是 什么 呢 ? 假设 我 们 看 到 有 2000 人 在 吃 了 没 清 
洗 的 水 果 后 生 了 病 , 但 是 还 有 2 个 人 吃 了 水 果 后 居然 没有 生病 , 还 有 几 个 
人 在 吃 了 没有 烤 熟 的 鸡肉 后 出 现 了 食物 中 毒 。 按照 穆 勒 的 方法 , 我 们 无 法 
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在 吃水 果 和 生病 之 间 找 到 任何 因果 联系 , 因为 吃 了 没 清洗 的 水 果 既 不 是 生 
病 的 必要 条 件 也 不 是 充分 条 件 。 在 现实 生活 中 , 有 很 多 因果 关系 并 不 是 每 
次 都 会 出 现 的 , 所 以 穆 勒 要 求 的 条 件 过 于 严格 了 。 一 般 而 言 , 我 们 不 能 仅 
凭 几 个 反例 就 完全 推翻 一 个 原因 ,但 这 种 方法 仍然 能 为 我 们 提供 一 个 直觉 
式 的 指导 原则 , 帮助 我 们 探索 各 种 因果 假设 , 而 且 这 种 方法 与 我 们 对 原因 
的 一 些 定性 研究 所 用 的 方法 是 一 致 的 。* 

在 现实 中 ， 只 有 一 个 原因 和 一 个 结果 的 情况 也 很 少见 。 也 许 人 们 吃 
比萨 饼 、 熬 夜 并 且 喝 了 大 量 咖啡 ， 结 果 导 致 同时 出 现 很 多 疾病 。 如 果 我 们 
看 到 人 们 既 出 现 了 疲劳 症状 , 又 出 现 了 肚子 疼 的 症状 , 但 是 这 些 既 疲劳 又 
肚子 疼 的 人 之 间 并 没有 什么 共同 点 ， 或 者 这 些 人 和 其 他 人 并 没有 什么 差 
别 , 那 我 们 应 该 怎么 做 呢 ? 有 些 情 况 下 , 我 们 可 以 将 导致 疲劳 和 肚子 疼 的 
原因 区 分 开 来 。 

TER 5-4 所 示 的 例子 中 ， 假 设 我 们 已 经 知道 熬夜 是 导致 疲劳 的 原因 。 
这 样 一 来 ， 就 可 以 用 熬夜 来 解释 Alan, Betty 和 Diane 感到 疲劳 的 事实 了 。 
1 于 我 们 已 经 知道 熬夜 并 不 会 导致 肚子 疼 , 所 以 可 以 假设 一 定 有 其 他 因素 
导致 了 肚子 疼 。 然 后 , 我 们 只 要 考察 一 下 所 有 肚子 疼 的 案例 之 间 有 什么 共 
同 点 和 不 同 点 就 可 以 了 。 一旦 排除 了 疲劳 和 熬夜 这 两 个 因素 , 剩 下 的 唯一 
一 个 共同 因素 就 是 喝 咖 啡 了 。 尽 管 熬夜 也 是 那些 肚子 疼 的 人 所 共有 的 特 
征 , 但 称 勒 假定 我 们 基本 上 可 以 排除 那些 已 知 的 因果 关系 。 如 果 我 们 知道 
熬夜 会 导致 疲 务 ， 那 么 就 可 以 考察 在 这 个 原因 和 结果 被 排除 后 还 剩 下 什 
么 。 如 果 还 剩 下 一 个 原因 和 一 个 结果 ， 那 么 这 个 原因 就 一 定 是 导致 剩 下 
的 这 个 结果 的 原因 。 这 就 叫 作 剩 余 法 。 不 过 ,这 个 方法 假定 了 我 们 已 经 知 
道 所 有 其 他 可 能 的 原因 导致 的 所 有 结果 ， 并 且 一 个 原因 只 会 导致 一 个 结 
果 。 如 果 现 实情 况 是 ,熬夜 和 喝 咖 啡 相互 作用 才 会 导致 肚子 疼 , 那么 我 们 
就 无 法 通过 剩余 法 来 找到 这 种 因果 关系 了 。 
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表 5-4 ”根据 穆 勒 的 剩余 法 ， 我 们 发 现 喝 咖 啡 会 导致 肚子 疼 





咖啡 比萨 饼 熬夜 ”功能 性 饮料 疲劳 AF 
Alan x X X X 是 是 
Betty X X 是 是 
Carl X X T T 
Diane x x 是 T 


我 们 可 以 根据 这 个 方法 做 出 一 些 假设 ， 以 此 来 推断 可 能 是 什么 原因 
引起 了 我 们 观察 到 的 现象 ， 但 我 们 无 法 用 它 来 证 实 某 个 关系 是 因果 关系 。 
接着 来 看 看 变量 集 或 者 变量 的 来 源 。 我 们 研究 的 变量 永远 都 只 是 所 有 可 能 
被 衡量 出 的 变量 的 一 个 子 集 , 它们 可 能 只 是 我 们 根据 感知 到 的 相关 性 选择 
出 来 的 ， 也 可 能 只 是 我 们 在 事后 分 析 数 据 时 实际 衡量 出 的 变量 。 

然而 ， 真 正 的 原因 可 能 并 不 在 那些 假设 之 中 ， 而 这 可 能 会 让 我 们 无 
法 找到 导致 某 种 结果 的 原因 ， 或 者 找到 的 可 能 只 是 表示 原因 的 一 个 迹象 。 
如 果 每 个 吃 比萨 饼 的 人 同时 也 喝 了 一 些 有 问题 的 自来水 , 而 我 们 的 变量 集 
中 却 没 有 包含 喝 水 这 个 变量 , 那 我 们 将 会 发 现 吃 比萨 饼 是 导致 某 种 结果 的 
一 个 原因 。 尽 管 它 其 实 并 不 是 一 个 原因 , 但 它 却 与 喝 水 这 个 变量 有 一 定 的 
关系 。 在 这 个 案例 中 ,即便 我 们 将 喝 水 这 个 变量 考虑 进去 ， 如果 吃 比萨 饼 
与 喝 水 这 两 个 因素 总 是 共同 出 现 ( 每 个 吃 比萨 饼 的 人 都 喝 水 , 每 个 喝 水 的 
人 都 吃 比萨 饼 )， 我 们 还 是 无 法 确定 吃 比 萨 饼 就 是 导致 某 种 结果 的 原因 。 
但 其 实在 这 种 情况 下 , 喝 水 和 吃 比萨 饼 这 两 个 因素 似乎 都 会 成 为 导致 某 种 
结果 的 原因 。 因为 我 们 从 来 没有 分 别 观察 过 这 两 个 变量 , 所 以 只 能 看 到 这 
两 个 潜在 的 原因 和 结果 之 间 存 在 一 种 完美 的 规律 性 ,这 个 问题 不 是 称 勒 的 
方法 独 有 的 , 而 是 我 们 根据 观察 数据 寻找 因果 关系 时 的 一 个 比较 普遍 的 问 
题 。 然而, 如果 我 们 能 够 使 用 实验 法 , 让 参与 者 在 吃 比萨 饼 的 时 候 不 喝 水 ， 
或 者 喝 水 的 时 候 不 吃 比萨 饼 ， 就 能 解决 这 个 问题 了 。 然 后 我 们 就 会 看 到 只 
有 那些 喝 了 水 的 人 《无 论 他 们 吃 不 吃 比萨 饼 都 一 样 ) 才 会 生病 。 
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再 来 看 看 计算 机 科学 家 的 那个 案例 。 也 许 那 些 程序 员 在 工作 的 时 候 
很 容易 吃 过 多 的 比萨 饼 。 如果 吃 过 多 的 比萨 饼 会 导致 体重 增加 , 那么 随 着 
比萨 饼 食 用 量 的 增加 , 我 们 应 该 能 够 看 到 这 些 人 的 体重 也 随 之 增加 。 这 就 
是 穆 勒 的 共 变 法 。 在 共 变 法 中 , 原因 和 结果 之 间 存 在 剂量 效应 一 一 随 着 原 
因 剂 量 的 增加 , 结果 的 剂量 也 随 之 增加 。 如 果 一 项 研究 声称 咖啡 可 以 降低 
某 个 年 龄 段 之 前 的 人 群 的 死亡 风险 , 那么 我 们 就 会 认为 每 个 人 的 咖啡 饮用 
量 会 影响 他 们 的 死亡 风险 .而 如 果 一 天 喝 1 杯 咖啡 和 一 天 喝 10 杯 咖 啡 的 结 
果 完 全 一 样 ， 那 么 实际 降低 死亡 风险 的 很 有 可 能 是 与 喝 咖 啡 共同 出 现 的 
其 他 因素 。 

当然 ， 实 际 情况 总 是 更 复杂 一 些 ， 原 因 和 结果 之 间 的 关系 也 并 不 总 
是 线性 关系 。 举 个 饮酒 的 例子 : 随 着 饮酒 量 的 增加 (在 一 定 范围 内 )， 饮 
酒 对 健康 的 好 处 也 会 增加 , 但 如 果 饮 酒 过 量 就 会 成 为 一 种 非常 不 健康 的 行 
为 。 有 一 个 本 形 曲线 反映 了 饮酒 量 与 冠 心 病 等 健康 问题 之 间 的 关系 〈 如 
图 5-1 所 示 ) 在 每 日 饮酒 量 从 0 bE EFT EM 20 m (大约 两 小 杯 ) 的 过 程 中 ， 
疾病 的 发 病 率 逐渐 降低 ， 但 到 了 20 克 以 后 ， 随 着 饮酒 量 的 增加 ， 发 病 率 
开始 上 升 。 与 之 类 似 的 关系 还 有 ， 人 们 假定 运动 强度 和 感染 疾病 的 概率 
之 间 存 在 的 联系 ,“ 以 及 喝 咖啡 和 心力 衰竭 等 健康 问题 之 间 存 在 的 联系 。” 
和 吃 药 一 样 ， 饮 酒 、 喝 咖啡 以 及 运动 等 活动 都 有 一 个 量 ， 超 过 这 个 量 之 
后 , 它们 就 可 能 会 危害 健康 。 因 此 ,过 了 某 个 量 之 后 ,我们 就 看 不 到 剂量 
效应 了 ; 相反 ,我 们 会 看 到 该 因素 产生 的 效果 开始 逐渐 减弱 而 不 是 不 断 
增强 。 
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图 5-1 J 形 曲 线 























John Snow 发 现 了 1854 年 伦敦 爆发 霍乱 的 原因 ， 这 是 历史 上 使 用 稳 




















勒 五 法 的 最 有 名 的 案例 之 一 。"” Snow 并 没有 明确 宣称 自己 采用 了 穆 勒 的 
方法 , 但 他 所 用 的 研究 方法 和 穆 勒 的 方法 是 建立 在 相同 的 原理 之 上 的 。 疫 
情 暴 发 时 ， 人 们 并 不 清楚 疾病 究 竞 是 如 何 传 播 的 ， 但 有 一 张 地 图 显示 疾 
病 的 发 病 率 在 不 同 地域 间 存在 明显 差异 。 这 个 疾病 是 人 传染 给 人 的 吗 ? 
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染 的 区 域 所 以 才 导 臻 了 疾病 的 暴发 ? 






































居住 地 有 什么 东西 引起 了 疾病 的 暴发 呢 ?” 还 是 说 因为 人 们 都 生活 在 被 感 





Snow 发 现 ， 很 多 死亡 都 发 生 在 某 个 特定 的 地 理 区 域 ， 而 且 还 都 靠近 
宽 街 ( Broad Street ) 的 水 泵 : 有 一 些 房子 更 加 靠近 另外 一 个 街 泵 ， 而 这 些 
房子 里 的 居民 只 有 10 个 人 死 于 霍乱 。 在 这 10 个 人 中 , 有 5 个 人 的 家 属 告 
诉 我 们 ， 这 些 死 者 总 是 去 宽 街 的 水 泵 取水 ， 因 为 他 们 更 喜欢 喝 那 里 的 水 。 
还 有 另外 3 个 死者 都 是 小 孩 ， 他 们 上 学 的 地 方 靠近 宽 街 的 水 泵 。” 





























Snow 发 现 ， 死 者 大 多 数 都 可 能 使 用 过 宽 街 水 泵 里 的 水 。 他 又 考察 了 








那些 似乎 和 大 多 数 死亡 案例 不 一 致 的 案例 , 发 现 这 些 人 虽然 不 住 在 宽 街 水 





泵 附近 , 但 使 用 的 也 是 宽 街 水 泵 里 的 水 。 这 里 用 的 正 是 穆 勒 的 契合 法 一 一 








在 所 有 出 现 某 种 结果 ( 比如 感染 霍乱 ) 的 案例 中 








寻找 共同 点 。Snow 还 使 用 
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了 差异 法 ， 因 为 他 写 过 :“ 在 伦敦 的 这 个 区 域 ， 除了 那些 习惯 饮用 上 述 泵 
井中 的 水 的 人 , 还 没有 出 现 其 他 感染 霍乱 的 特殊 情况 。”” 他 证 实 了 霍乱 的 
发 病 率 在 使 用 了 那个 水 泵 的 人 群 中 上 升 了 ， 而 且 也 只 在 那个 人 群 中 上 升 了 。 


5.1.2 ”各 种 复杂 的 原因 


穆 勒 五 法 有 一 个 问题 : 一 个 原因 导致 某 种 结果 出 现 的 可 能 性 的 大 小 ， 
取决 于 除 这 个 原因 之 外 还 存在 哪些 其 他 因素 。 比 如 说 , 分 别 服用 两 种 药物 
可 能 对 血糖 没有 任何 影响 ,但 同时 服用 可 能 就 会 产生 相互 作用 ， 从 而 显 
著 地 提高 血糖 值 。 要 想 解 决 这 个 问题 ， 就 不 能 只 看 单一 原因 和 单一 结果 
之 间 成 对 的 关系 ， 而 是 要 考虑 导致 某 种 结果 的 一 系列 因素 的 组 合 。 比 如 
说 ， 这 一 起 交通 事故 可 能 是 酒 驾 和 汽车 间距 太 近 共 同 导致 的 ， 而 另 一 起 
交通 事故 可 能 是 能 见 度 太 低 、 路 面 结 冰 和 和 鲁莽 驾驶 共同 导致 的 ， 还 有 一 
起 交通 事故 则 可 能 是 发 短信 和 超速 共同 导致 的 。 

我 们 知道 ， 在 流行 病 学 研究 中 ， 各 种 原因 都 是 相互 关联 的 ， 人 们 与 
各 种 环境 的 长 期 接触 .生活 方式 以 及 严重 暴露 ( 比如 接触 某 种 传染 性 疾病 ) 
等 各 种 因素 会 共同 影响 人 们 的 健康 状况 。 这 种 情况 在 流行 病 学 领域 经 常 出 
M, K, MITIK Kenneth Rothman 提出 用 饼 形 图 来 表示 这 些 原因 组 
Ro V 原因 饼 形 图 是 由 一 系列 足以 导致 某 种 结果 的 因素 共同 组 成 的 ， 它 包 
含 能 产生 某 种 结果 的 所 有 必要 因素 。 图 5-2 展示 的 是 导致 三 起 交通 事故 的 
原因 组 合 。 











































































































































































































图 5-2 ”三 起 交通 事故 的 原因 组 合 














第 5 章 观察 法 | 109 























在 这 个 例子 中 ,每 一 个 饼 形 图 都 足以 让 这 个 结果 发 生 ， 所 以 每 一 次 
这 些 因素 出 现时 都 会 发 生 一 起 交通 事故 。 然而, 由 于 有 很 多 不 同 的 原因 组 





合 都 能 导致 这 个 结果 , 所 














以 这 些 因素 中 的 每 一 个 因素 都 不 是 引起 交通 事故 














的 必要 条 件 。 休 谎 和 穆 勒 的 要 求 是 , 每 次 某 个 原因 出 现时 都 会 导致 相应 的 
结果 ,但 有 时 候 让 这 个 原因 起 作用 的 那些 必要 条 件 可 能 根本 就 没有 出 现 ， 
或 者 每 次 只 有 在 出 现 某 个 原因 时 才 会 出 现 相 应 的 结果 。 但 有 时 不 同 的 原因 
能 导致 同样 的 结果 。 因 此 , 休 谎 和 穆 勒 的 要 求 是 一 个 极为 严格 的 条 件 。 在 



























































现实 生活 中 , 很 多 结果 可 能 是 通过 多 种 方式 产生 的 , 并 且 这 种 情况 往往 都 





存在 一 系列 原因 。 








然后 ， 原 因 的 概念 就 变 成 了 因素 组 合 中 的 一 个 组 成 部 分 ， 这 组 因素 




















在 一 起 时 足以 导致 某 种 结果 , 但 这 个 组 合 可 能 并 不 是 出 现 某 种 结果 的 必要 





条 件 ， 因 为 像 这 样 的 原因 组 合 可 能 有 很 多 。 这 就 是 John Leslie Mackie 的 
方法 ,他 认为 原因 不 过 是 那些 INUS 条 件 ( 非 必要 充分 条 件 中 的 非 充 分 必 





要 部 分 ) 而 已 。 “在 饼 形 























图 那个 例子 中 ， 每 一 块 单独 的 饼 形 图 都 是 不 充分 























的 ,因为 要 想 产生 某 种 结果 还 需要 和 其 他 几 块 结合 起 来 共同 起 作用 。 但 是 ， 











每 一 块 都 是 必要 的 ， 因 为 如 果 缺 少 其 中 任何 一 块 ， 这 种 结果 就 不 会 出 现 。 














男 一 方面 , 每 个 饼 形 图 本 身 又 都 是 非 必 要 条 件 , 因为 可 能 会 存在 多 个 饼 形 






































图 , 它们 中 的 每 一 个 都 足以 导致 这 样 的 结果 。 因 此 , 我 们 不 应 该 只 将 经 济 
因素 、 其 他 政党 的 广告 或 者 支持 率 锁定 为 导致 某 个 竞选 结果 的 主要 原因 ， 

















而 是 要 再 现 所 有 的 影响 因素 ， 或 许 还 可 以 尝试 分 析 它 们 各 自 的 重要 性 。 
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然而 ， 并 不 是 所 有 的 原因 都 是 INUS 条 件 。 比 如 说 ,因果 关系 可 能 并 
不 是 永远 不 变 的 , 所 以 即便 我 们 拥有 所 有 可 能 的 信息 , 而 且 所 有 的 必要 条 















































件 也 都 出 现 了 , 但 是 结果 却 并 不 会 百分之百 出 现 。 这 叫 作 非 决定 论 ， 放 射 








PETER 




















就 是 一 个 例子 。 在 这 个 过 程 中 , 我 们 永远 无 法 确定 某 个 粒子 是 否 会 
在 某 个 具体 的 时 间 发 生 衰变 , 只 能 知道 这 件 事情 发 生 的 概率 。 衰变 永远 都 





























不 会 有 NUS 条 件 , 因为 衰变 是 没有 充分 条 件 的 。 同样 ,如 果 变 量 组 合 选择 
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不 当 ( 比 如 比萨 饼 和 水 的 例子 )， 也 可 能 会 出 现 一 些 并 不 是 构成 原因 的 、 表 








面 上 的 INUS 条 件 。 这 些 推 理 的 准确 性 和 完整 性 永远 取决 于 数据 的 完整 性 。 





5.2 概率 


5.2.1 为 什么 要 使 用 概率 




















本 章 是 由 一 则 广告 上 的 一 句 话 展开 的 ， 那 句 话 是 这 样 的 :， “如 果 你 




















业 、 找 到 工作 和 婚 后 生子 这 些 条 件 都 成 立 , 那么 她 训 


高 中 毕业 了 , 找到 了 一 份 工 作 , 并 且 婚 后 才 生 的 孩子 , 那么 你 98% 不 会 穷 
困 深 倒 。” 这 句 话 试图 暗示 一 个 因果 关系 : 对 于 一 个 人 来 说 ， 如 果 高 中 毕 
(A 98% 的 概率 不 会 贫 











穷 。 人 们 之 所 以 会 对 这 个 统计 数据 如 此 感 兴趣 , 是 因为 这 个 概率 十 分 接近 






































100%。 但 是 ， 如 此 高 的 概率 并 不 意味 着 这 个 关系 训 

















DEAS 


关系 。 可 能 有 


些 关 系 出 现 的 概率 很 高 , 但 并 不 是 因果 关系 , 还 有 一 些 关 系 是 真正 的 因果 
关系 , 但 这 些 因 果 关 系 中 的 原因 可 能 只 是 降低 了 结果 出 现 的 概率 , 或 者 并 
未 改变 结果 出 现 的 概率 。 那 么 因果 概率 的 理念 到 底 有 什么 用 处 呢 ? 





















































我 们 之 所 以 需要 使 用 概率 法 〈 这 个 方法 并 不 要 求 原因 能 百分之百 导 





























致 相应 的 结果 ， 也 不 要 求 每 次 出 现 某 个 结果 之 前 都 会 出 现 某 个 原因 )， 是 
为 有 些 关 系 本 身 就 是 不 确定 的 ,比如 放射 性 衰变 的 例子 ,在 这 些 情况 下 ， 









































即便 穷尽 毕生 所 学 , 我 们 仍然 无 法 确定 某 个 结果 是 否 会 发 生 。 因 为 这 种 情 
况 既 不 存在 前 面 几 种 方法 要 求 的 规律 性 , 也 不 存在 具有 任何 规律 的 变量 组 
合 。 物 理学 领域 经 常 出 现 具有 不 确定 性 的 案例 〈 比如 量子 力学 )， 但 这 种 
案例 在 日 常生 活 中 更 加 常见 ， 比 如 设备 出 现 故障 的 时 候 。 

在 很 多 情况 下 ， 我 们 之 所 以 认为 有 些 事物 看 起 来 具有 不 确定 性 ， 只 















































是 因为 我 们 缺乏 对 事物 的 认 知 一 一 即使 这 些 事物 的 所 有 信息 都 是 完全 可 


以 预测 出 来 的 。 并 不 是 每 一 个 接触 石棉 的 人 都 会 得 癌症 , 有 些 药物 只 会 在 
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一 部 分 病人 身上 出 现 副 作用 , 而 且 某 些 类 似 的 情况 也 并 不 是 每 次 都 会 导致 
股市 泡沫 。 如 果 掌 握 了 某 种 药物 的 作用 机 制 , 或 者 能 够 观察 到 足够 多 这 种 
药物 的 副作用 案例 并 且 知 道 它 在 哪些 人 身上 产生 了 副作用 , 那 我 们 就 能 找 
到 这 种 药物 产生 副作用 的 必要 条 件 。 

绝 大 多 数 情况 下 ， 我 们 需要 处 理 的 不 仅 是 观察 数据 ( 我 们 不 能 强迫 
人 们 去 吸烟 以 便 观察 谁 会 得 癌症 )， 还 要 处 理 不 完整 的 数据 。 这 可 能 意味 
着 我 们 正在 错过 一 些 变量 ( 有 氧 代 谢 能 力 可 能 是 估算 出 来 的 ， 而 不 是 通过 
在 跑步 机 上 进行 最 大 摄 氧 量 测试 测量 出 来 的 ), 并 且 只 能 观察 到 一 个 有 限 的 
时 间 段 (手术 结束 一 年 后 的 恢复 状况 ， 而 不 是 三 十 年 后 的 恢复 状况 )， 还 
可 能 意味 着 样本 之 间 的 时 间 间 隔 比 我 们 想 要 的 大 得 多 ( 每 小 时 的 脑 代 询 
情况 ， 而 不 是 像 脑 电 图 一 样 的 数据 )。 这 可 能 是 为 了 节约 成 本 ( 对 于 大 规 
模 的 研究 来 说 ， 最 大 摄 氧 量 测试 不 仅 成 本 高 、 耗 时 长 ， 而 且 对 一 些 身 体 不 
够 健康 的 参与 者 来 说 可 能 也 不 安全 )， 也 可 能 是 数据 采集 的 可 行 性 导致 的 
( 我们 几乎 不 可 能 花费 几 十 年 的 时 间 去 追踪 研究 某 个 参与 者 )， 还 可 能 是 
技术 上 的 局 限 性 导致 的 (用 微 透析 技术 来 测量 代谢 活动 是 一 个 缓慢 的 过 
程 )。 在 使 用 概率 法 时 ， 很 容易 混淆 这 两 种 适用 于 不 同 原因 的 概率 ， 一 个 
适用 于 缺乏 认 知 的 情况 ,一 个 适用 于 不 确定 的 关系 本 身 。 但 是 , 我 们 一 定 
要 记 住 这 是 两 种 不 同 的 概率 。 

之 所 以 要 使 用 概率 来 定义 因果 关系 ， 是 因为 我 们 不 仅 想 要 知道 某 个 
事物 到 底 是 不 是 原因 , 还 想 要 知道 这 个 事物 到 底 有 和 多重 要。 具体 来 说 ,就 
是 我 们 想 要 将 某 种 药物 的 常见 副作用 和 罕见 副作用 区 分 开 来 , 或 者 想 要 找 
到 最 有 可 能 增加 就 业 机 会 的 政策 。 要 想 量化 某 个 原因 对 某 个 结果 造成 的 影 
响 , 可 以 在 使 用 连续 变量 的 情况 下 测量 这 个 结果 的 大 小 ( 比如 在 某 些 新 闻 
播 出 之 后 ， 某 个 股票 的 价格 上 涨 了 多 少 )， 或 者 在 使 用 不 连续 变量 的 情况 
下 测量 这 个 结果 发 生 的 概率 〈 比如 某 个 股票 价格 上 涨 的 可 能 性 有 多 大 )。 

然而 一 般 情 况 下 我 们 看 到 的 关于 因果 关系 的 报道 只 会 表明 某 个 原因 
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增加 了 出 现 某 种 结果 的 风险 。 下面 几 行文 字 摘 自 儿 篇 关于 科技 论文 的 报道 
的 开头 部 分 。 


“科学 家 们 做 过 报告 ,说 治 好 抑郁 症 患者 的 失眠 问题 可 以 将 
他 们 完全 康复 的 概率 提高 一 倍 。” 5 

“哈佛 大 学 公共 卫生 学 院 研究 人 员 的 一 项 最 新 研究 显示 ,每 天 
喝 几 杯 咖啡 似乎 能 让 男性 和 女性 自杀 的 风险 减少 50% 左 右 。” 1 

“科学 家 们 在 本 周三 的 报告 中 讲 到 ， 随 着 年 龄 的 增长 ， 随 机 
突变 的 基因 数量 越 来 越 多 。 因 此 , 大龄 男子 比 年 轻 男 子 更 有 可 能 
拥有 一 个 患 有 孤独 症 或 精神 分 裂 的 儿子 。 这 是 科学 家 们 第 一 次 对 
这 种 逐年 增加 的 影响 进行 量化 研究 。” T 


有 很 多 关于 科技 论文 的 报道 在 开头 只 会 提 一 下 风险 的 增加 或 减少 ， 
而 增加 或 减少 的 准确 数据 则 要 留 到 几 段 之 后 才 说 。 即 便 如 此 , 这 些 例 子 中 
给 出 的 信息 仍然 是 相对 的 : 概率 增加 了 一 倍 或 风险 降低 了 一 半 。 对 一 些 事 
件 来 说 , 概率 增加 了 一 倍 可 能 听 起 来 差别 很 大 , 但 如 果 这 只 是 将 一 件 事变 
成 了 两 件 事 , 那 这 个 概率 的 说 服 力 就 大 打折 扣 了 。 比 如 说 ,中 风 的 风险 可 
能 从 0.0000001 增加 到 了 0.0000002， 也 可 能 从 0.1 增加 到 了 0.2。 这 两 种 
情况 的 概率 都 增加 了 一 倍 , 但 在 第 一 种 情况 下 , 增加 一 倍 的 是 一 个 很 小 的 
数字 ， 而 增加 后 的 数值 仍然 是 一 个 很 小 的 数字 。 图 5-3 向 我 们 直观 地 展示 
了 这 一 差别 。 在 第 一 种 情况 下 ,一 千 万 个 事件 中 只 有 一 个 这 样 的 事件 , 增 
加 一 倍 之 后 也 只 有 两 个 这 样 的 事件 。 图 中 每 一 个 黑 点 表示 一 个 这 样 的 事 
件 ， 而 每 一 个 灰 点 表示 一 万 个 事件 。 因 此 ， 即 便 相 对 风险 都 增加 了 一 售 ， 
但 在 了 解 这 一 概率 的 绝对 值 后 ， 我 们 可 能 就 会 改变 原本 的 观点 。 后 邓 
在 介绍 实验 的 实施 与 评估 以 及 做 决策 等 内 容 时 ， 要 牢记 这 种 结果 大 小 或 
概率 增加 问题 。 当 你 在 阅读 关于 新 的 科学 发 现 的 报道 时 ， 也 要 想 想 这 个 
问题 。 
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(c) 概率 0.0000001 (d) 概率 0.0000002 


图 5-3 在 上 面 两 张 图 中 , 每 一 个 点 代表 一 万 个 事件 。 而 在 下 面 两 张 
图 中 , 黑 点 代表 的 是 一 个 事件 ， 灰 点 代表 一 万 个 事件 。 从 左 
图 到 右 图 ， 黑 点 所 代表 事件 发 生 的 概率 都 增加 了 一 倍 , 但 也 
要 考虑 事件 的 总 数 


















































考察 样本 的 大 小 〈 比如 研究 的 人 口 群体 有 多 大 ) 尤为 重要 ， 如 果 观 
察 的 样本 数量 不 显著 ,我 们 可 能 都 无 法 将 那些 结果 区 分 出 来 。" 某 个 差异 
的 出 现 可 能 仅仅 是 自然 变化 、 噪 声 或 测量 失误 引起 的 。 比 如 说 , 根据 风险 
因素 的 不 同 ， 见 却 致 命 的 中 风 ) 的 证 
状 每 年 在 10 万 人 中 只 会 出 现 8 例 。 这 就 意味 着 ， 如 果 我 们 用 一 年 的 时 
间 去 观察 10 万 人 , 或 者 用 10 年 的 时 间 去 观察 1 万 人 ， 只 能 看 到 8 起 这 种 
中 风 事 件 。 而 如 果 观 察 一 个 更 小 的 样本 , 那么 我 们 观察 到 的 这 一 事件 发 生 
的 概率 就 会 远 远 低 于 它 真正 发 生 的 概率 。 因 为 在 一 个 小 样本 中 , 我 们 可 能 
会 观察 到 8 起 这 样 的 事件 ,也 可 能 会 观察 到 0 起 这 样 的 事件 , 这 就 会 导致 
我 们 对 这 种 风险 得 出 错误 的 结论 。 


5.2.2 ”从 概率 到 原因 
休 资 的 研究 方法 的 核心 是 原因 和 结果 之 间 存 在 的 规律 性 ， 而 概率 法 
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的 基本 理念 则 是 原因 让 结果 出 现 的 可 能 性 更 大 。 

如 果 一 件 事 与 另 一 件 事 之 间 没 有 因果 联系 ， 那 么 在 第 一 件 事 出 现 后 ， 
第 二 件 事 出 现 的 概率 应 该 不 会 发 生 任何 变化 。 抛 硬币 时 正面 朝 上 和 反面 朝 
上 的 概率 都 是 50%， 而 且 每 一 次 抛 硬 币 都 是 一 个 独立 的 事件 ， 所 以 每 一 次 
正面 或 反面 朝 上 的 概率 并 不 会 因为 上 一 次 抛 硬 币 的 结果 而 发 生 改变 。 即使 
上 一 次 抛 硬币 的 结果 是 反面 朝 上 ,那么 接 下 来 每 一 次 抛 便 币 时 正面 朝 上 的 
概率 依然 是 50%. E 5-4a 用 分 布 图 ( 也 叫 灸 让 图 或 矩阵 图 ) 展示 了 这 种 
情况 。 横 轴 代 表 的 是 第 一 次 抛 硬 币 时 可 能 出 现 的 结果 ( 正面 或 反面 )， 纵 
轴 代表 的 是 第 二 次 抛 硬币 时 可 能 出 现 的 结果 ( 也 是 正面 或 反面 )。 长 条 的 
宽度 代表 的 是 第 一 次 抛 硬币 时 正面 或 反面 朝 上 的 概率 ( 如 果 这 个 硬币 十 分 
不 公正 ， 那 么 第 一 个 条 形 可 能 会 十 分 狭窄 )， 而 灰色 长 条 的 高 度 代 表 的 是 
第 二 次 抛 硬币 时 正面 朝 上 的 概率 。( 剩余 区 域 代表 的 是 第 二 次 抛 硬币 时 反 
面 朝 上 的 概率 。) 因为 每 一 种 结果 出 现 的 概率 都 是 完全 一 样 的 ， 所 以 图 中 每 
个 部 分 的 大 小 都 是 一 样 的 。2” 相反 ， 由 于 政治 信仰 和 政治 联盟 的 不 同 ， 基 
个 人 成 为 副 总 统 候选 人 的 概率 则 会 因为 总 统 候选 人 的 不 同 而 上 升 或 下 降 ， 
所 以 这 些 事件 是 相互 依赖 的 。 

从 直觉 上 来 说 ， 如 果 某 件 事 会 导致 某 个 结果 ， 那么 在 这 件 事 发 生 后 ， 
这 个 结果 出 现 的 可 能 性 应 该 比 平 时 高 得 多 。 由 于 蚊子 会 传播 症 疾 , 因此 如 
果 某 个 地 区 的 蚊子 感染 了 症 疾 , 那么 这 个 地 区 的 症 疾 发 病 率 应 该 更 高 。 原 
也 可 能 会 让 某 个 事件 发 生 的 可 能 性 变 小 ,或 者 说 原因 也 可 能 会 让 某 个 事 
件 不 发 生 的 可 能 性 变 大 。 如 果 钾 能 够 减缓 肌肉 痉挛 现象 , 那么 人 们 在 服用 
了 钾 之 后 ， 肌 肉 痉 挛 的 病例 就 应 该 有 所 减少 ( 如 图 5-4b 所 示 )。 在 这 个 图 
中 , 服用 钾 的 概率 比 未 服用 钾 的 概率 要 低 , 所 以 我 们 用 一 个 更 罕 的 长 条 来 
表示 服用 钾 的 概率 。 然 而 ,这 个 长 条 形 的 大 部 分 都 是 阴影 ,因为 在 服用 了 钾 
之 后 , 未 出 现 痉挛 症状 的 概率 要 高 于 出 现 痉挛 症状 的 概率 。 相 反 ,在 未 服 
用 钾 的 情况 下， 出 现 痉挛 症状 的 概率 比 未 出 现 痉 挛 症 状 的 概率 要 高 得 多 。 
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IET 反 服用 钾 ”未 服用 钾 
(a) 连续 抛 硬币 的 事件 (b) 肌肉 痉挛 症状 的 出 现 






























































是 相互 独立 的 取决 于 是 否 服用 了 钾 

















图 5-4 这 两 个 图 表示 的 是 条 件 性 概率 。 一 旦 你 选 定 一 个 沿 着 底部 横 线 发 生 的 





















































事件 〈 比 如 服用 钾 )， 那 么 另 一 个 事件 〈 比如 出 现 痉挛 症状 ) 的 概率 














就 可 以 通过 长 条 的 阴影 部 分 来 表示 。 在 服用 钾 〈 人 小 条 形 ) 之 后 ， 出 现 
痉挛 症状 的 可 能 性 下 降 。 但 是 ， 每 一 次 抛 硬币 〈 同样 尺寸 的 条 形 ) 之 




















后 ， 下 一 次 抛 硬 币 时 正面 朝 上 或 者 反面 朝 上 的 概率 者 














了 相同 


概率 的 提升 或 降低 可 能 导致 人 们 错误 地 将 没有 因果 关系 的 两 个 事件 
联系 在 一 起 ( 非 原 因 的 事件 似乎 也 能 提升 某 种 结果 出 现 的 概率 )， 还 可 能 
导致 人 们 错过 两 个 事件 之 间 的 因果 关系 ( 不 是 每 一 个 原因 都 能 提升 某 种 结 
果 出 现 的 概率 )。 我 们 在 第 3 章 初步 探讨 了 相关 性 以 及 相关 性 产生 的 方 
式 。 相关 性 的 产生 有 时 完全 是 因为 巧合 ; 有 时 可 能 是 因为 我 们 验证 的 假设 
KE, 所 以 必然 会 碰巧 发 现 一 些 似乎 具备 显著 性 的 关系 ; 也 有 可 能 是 因为 
























































所 用 的 变量 并 不 能 准确 反映 真实 的 原因 。 有 人 说 某 个 节食 方案 能 在 一 定 程 











度 上 起 到 减肥 的 作用 ,但 起 到 减肥 效果 的 相关 变量 可 能 只 是 节食 的 行为 ， 

而 不 是 我 们 正在 验证 的 这 个 节食 方案 。 还 有 一 种 可 能 ， 虽然 我 们 只 考察 了 
两 个 因素 之 间 的 一 种 关系 ， 但 可 能 会 由 于 一 些 结构 因素 而 发 现 很 多 相似 
的 关系 ,第 3 章 还 讲 了 人 们 是 如 何 发 现 一 个 国家 的 巧克力 消费 量 和 该 国 获 
得 诺 贝尔 奖 的 人 数 之 间 存 在 相关 性 的 。 也 许 红酒 、 奶 酷 或 咖啡 的 消费 量 和 
获得 诺 贝 尔 奖 的 人 数 之 间 也 同样 有 着 很 高 的 相关 性 。 有 一 项 研究 发 现 , 除 
了 其 他 因素 之 外 ， 诺 贝尔 获奖 人 数 和 宜家 家 居 (KEA ) 的 店铺 数 也 有 相 
关 性 。” 因此， 巧克力 的 消费 量 可 能 只 是 一 个 反映 某 种 人 口 特征 的 指标 ， 
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这 个 特征 可 能 是 一 个 国家 的 财富 和 资源 ,而 这 个 特征 才 是 既 让 人 们 消费 更 
多 巧克力 ， 又 提升 人 们 获得 诺 贝尔 奖 概率 的 原因 。 

有 时 ， 一 个 变量 似乎 会 提升 另 一 个 变量 出 现 的 可 能 性 ， 但 并 不 是 真 
正 导致 另 一 个 变量 出 现 的 原因 。 这 种 现象 往往 是 由 上 面 这 种 共同 原因 导致 
的 。 比 如 说 ， 经 济 衰 退 既 能 导致 通胀 率 下 降 ， 也 能 导致 失业 率 上 升 ， 而 通 
上 胀 率 下 降 和 失业 率 上 升 这 两 个 因素 好 像 也 都 能 提升 另 一 方 出 现 的 概率 。 
这 里 只 研究 成 对 的 变量 , 以 便 搞 清楚 其 中 一 个 变量 的 出 现 是 否 会 提升 另 一 
个 变量 出 现 的 可 能 性 。 当 遇 到 这 种 共同 原因 ( 当 所 有 变量 都 被 测量 了 之 后 ) 
导致 的 混乱 局 面 时 ， 可 以 尝试 用 一 个 变量 来 解释 其 他 变量 之 间 的 相关 性 ， 
看 看 是 否 解 释 得 通 。 这 是 哲学 家 们 ( 包括 Suppes、Good 和 Reichenbach ) 
提炼 出 的 许多 概率 法 的 核心 特征 ， 也 是 使 用 计算 法 从 数据 中 寻找 原因 的 
依据 。 

假设 某 种 疾病 会 引起 疲劳 , 并 且 人 们 通常 会 使 用 一 种 特定 的 药物 来 治 
疗 这 种 疾病 。 我 们 可 以 设想 一 下 ， 如 果 疲 劳 完全 是 这 种 疾病 引起 的 ， 而 且 
服用 的 药物 并 没有 改善 或 加 重 疲劳 的 症状 ， 那 么 服用 这 种 药物 所 产生 的 变 
化 是 不 会 对 疲劳 症状 产生 影响 的 。 如 果 病 情 保持 稳定 ， 那 么 我 们 将 无 法 从 
其 他 变量 上 得 到 任何 信息 。 这 种 将 一 个 共同 原因 造成 的 各 种 结果 分 开 来 看 
的 过 程 就 叫 “ 筛 选 法 ”。” 

图 5-5a 中 有 药物 和 疲劳 两 个 变量 ， 而 且 似 乎 前 者 提升 了 后 者 出 现 的 
可 能 性 。 在 服药 的 情况 下 ， 表 示 疲 劳 的 灰色 条 形 相 对 高 一 些 ; 而 在 未 服药 
的 情况 下 ,表示 疲劳 的 灰色 条 形 相对 低 一 些 , 这 意味 着 在 服药 的 情况 下 出 
现 疲劳 症状 的 可 能 性 比 在 未 服药 的 情况 下 出 现 疲劳 症状 的 可 能 性 要 大 。 然 
而 ， 如 果 我 们 将 有 这 种 疾病 的 人 和 没有 这 种 疾病 的 人 分 开 来 看 (图 5-5b 
和 图 5-5c )， 就 会 发 现 无 论 他 们 有 没有 服药 ， 这 些 人 出 现 疲 劳 症 状 的 概率 
都 是 一 样 的。 一 旦 我 们 了 解 了 疾病 这 个 因素 , 就 会 知道 这 种 药物 不 会 改变 
疲劳 症状 出 现 的 概率 。 
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没有 疲劳 pare 没有 疲劳 
有 疲劳 有 疲劳 
症状 定居 glare 
服药 RRA 服药 RRS RA 未 服药 
(a) 未 区 分 有 无 疾病 (b) 有 疾病 (c) 无 疾病 














图 5-5 在 不 考虑 参与 者 有 无 疾病 的 情况 下 ( 如 图 5-5a 所 示 )， 服 药 


和 疲劳 之 间 似 乎 存在 相关 性 。 人 然而 , 在 考虑 参与 者 有 无 疾病 
的 情况 下 ， 服 药 和 疲劳 之 间 不 存在 相关 性 ( 无论 是 否 服药 ， 





疲劳 症状 出 现 的 概率 都 是 一 样 的 ) 





当 一 连 串 事件 共同 发 生 时 ， 也 可 以 将 它们 分 开 来 看 。 我 们 假设 上 面 




















这 个 例子 的 另 一 种 情况 : 参与 者 得 了 某 种 疾病 , 医生 给 他 开 了 一 种 药 ， 而 
这 种 药 确 实 有 引起 疲劳 的 副作用 。 如 果 这 几 个 因素 之 间 真 正 的 关系 是 “ 疾 
病 导致 服药 ,服药 导致 疲劳 "， 那 么 我 们 就 会 发 现 这 种 疾病 会 提升 出 现 疲 






































劳 症 状 的 概率 。 为 了 能 够 采取 更 加 直接 的 干预 措施 , 我 们 通常 都 想 
直接 的 因果 关系 。 所 以 为 了 避免 出 现 疲劳 症状 ,病人 应 该 停止 服药 或 者 改 








中 找到 最 


服 其 他 药物 。 但 如 果 我 们 错误 地 发 现 这 种 疾病 和 药物 都 会 导致 病人 出 现 疲 
劳 症 状 , 就 无 法 知道 改 服 其 他 药物 能 否 防 止 疲劳 症状 出 现 了 。 但 如 果 我 们 
再 次 将 是 否 服药 作为 前 提 条 件 ， 疾 病 和 疲劳 之 间 的 概率 关系 就 不 存在 了 。 

没有 什么 方法 是 完美 无 缺 的 ， 筛 选 法 能 否 成 功 还 要 取决 于 我 们 是 否 
能 找到 真正 的 共同 原因 。 如 果 经 济 误 退会 导致 通胀 率 下 降 和 失业 率 上 升 ， 























但 我 们 却 不 知道 经 济 是 否 处 于 衰退 阶段 , 那 就 无 法 用 筛选 条 件 来 证 明 通胀 


























率 和 失业 率 之 间 的 因果 关系 是 虚假 的 。 我 们 找到 的 关系 到 底 是 正确 的 还 是 

















错误 的 完全 取决 于 是 否 找 到 了 正确 的 变量 集 。 第 6 章 介绍 计算 法 上 

















的 时 候 还 














会 遇 到 这 个 问题 有 些 方法 确实 可 以 明确 有 些 情况 是 否 存 在 隐藏 
， 但 对 于 计算 法 而 言 ， 这 仍然 是 一 个 尚未 解决 的 问题 。 
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问题 还 不 止 于 此 。 有 些 情况 并 不 存在 可 以 分 开 两 种 结果 的 单一 变量 。 
假设 Alice 和 Bob 都 喜欢 上 机 器 学 习 课程 , 而 且 都 喜欢 上 下 午 的 课 。 那么 ， 
无 论 我 们 是 以 上 课 的 内 容 为 条 件 还 是 以 上 课 的 时 间 为 条 件 , 都 无 法 完全 将 
Alice 和 Bob 去 上 课 的 可 能 性 区 分 开 。 如 果 我 们 只 知道 某 个 课程 的 上 课时 
间 ， 那 么 仍然 能 够 从 Bob 是 否 上 课 的 信息 中 推理 出 Alice 有 没有 去 上 这 和 党 
课 。 因 为 Bob 的 上 课 与 否 可 以 向 我 们 暗示 这 堂 课 的 内 容 。 在 这 个 案例 中 ， 
没有 一 个 单一 变量 可 以 将 Alice 和 Bob 去 上 课 的 可 能 性 分 开 。 假如 我 们 增 
加 一 个 变量 , 这 个 变量 只 有 在 某 个 课程 的 上 课时 间 是 下 午 且 课程 内 容 为 机 
器 学 习 的 情况 下 才能 成 立 , 那么 问题 就 解决 了 。 但 是 , 我 们 首先 需要 对 这 
个 问题 以 及 潜在 的 因果 关系 有 所 了 解 , 这 样 才能 知道 是 否 需 要 增加 这 个 复 
杂 的 变量 一 一 但 我 们 并 不 总 是 能 够 做 到 这 一 点 。 到 目前 为 止 , 我 们 还 没有 
讨论 过 时 间 问 题 ， 因 为 我 们 已 经 理所当然 地 认为 原因 会 出 现在 结果 之 前 。 
但 是 单一 变量 能 够 解释 一 种 相关 性 的 情况 不 止 一 种 , 还 有 一 种 情况 我 们 通 
常 不 会 纳入 分 析 ， 这 种 情况 就 是 各 种 关系 会 随 着 时 间 而 发 生 改 变 的 情况 。 
要 想 知道 筛选 法 的 失败 案例 ， 可 以 回忆 一 下 本 节 开 头 介绍 的 那 几 个 
不 确定 性 案例 。 如 果 一 件 设备 有 问题 , 那 我 们 可 能 无 法 完全 将 它 造 成 的 各 
种 结果 区 分 开 来 。 举 一 个 常见 的 例子 : 一 个 开关 出 了 故障 ， 它 既 能 打开 电 
视 也 能 打开 电灯 ， 但 并 不 是 每 次 都 能 让 电路 闭合 。 如 果 电 视 打 开 了 ， 灯 也 
会 打开 ,反之 亦 然 。 但 是 ， 并 不 是 每 次 打开 开关 都 能 同时 打开 这 两 个 设备 。 
我 们 可 以 增加 第 四 个 表示 电路 是 否 闭 合 的 变量 来 解决 这 个 问题 。 但 是 ， 我 
们 首先 要 对 这 个 问题 的 结构 有 所 了 解 〈 但 我 们 并 不 总 是 能 够 做 到 这 一 点 )， 
这 样 才能 知道 是 否 有 必要 增加 第 四 个 变量 。 

要 想 解决 这 个 问题 ， 不 是 要 去 寻找 某 个 准确 的 关系 ， 而 是 要 看 看 在 
其 他 因素 保持 不 变 的 情况 下 , 一 个 可 能 的 原因 对 某 个 结果 的 影响 究竟 有 多 
大 。 我 们 不 要 求 在 真正 的 原因 保持 不 变 的 情况 下 ,无 论 是 否 存在 虚假 因素 ， 
某 种 结果 出 现 的 概率 都 是 完全 一 样 的 , 而 是 要 求 某 种 结果 出 现 的 概率 只 会 
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发 生 很 小 的 变化 。“ 很 小 ”这 个 词 很 模糊 〈 这 个 值 到 底 要 多 大 才能 算是 因 
果 关 系 呢 )， 但 是 我 们 可 以 使 用 统计 方法 来 衡量 这 些 变化 的 显著 性 。 

到 目前 为 止 , 我 们 已 经 考察 了 所 有 能 够 让 不 是 原因 的 事物 也 能 提高 
某 种 结果 出 现 的 概率 的 方法 。 但 是 , 有 时 一 个 真正 的 原因 却 可 能 无 法 提升 
某 种 结果 出 现 的 概率 。 某 些 原因 会 阻碍 结果 的 出 现 , 比如 用 来 预防 疾病 的 
疫苗 。 这 些 问 题 很 容易 处 理 。 我 们 可 以 根据 某 些 原因 会 降低 某 种 结果 出 现 
的 可 能 性 这 一 特征 来 重新 定义 原因 , 也 可 以 将 某 种 结果 的 反例 作为 我 们 关 
注 的 结果 〈 即 不 出 现 疾病 )。 但 在 另 一 些 情况 下 ， 正 相关 的 原因 似乎 降低 
了 某 种 结果 出 现 的 概率 , 或 者 对 某 种 结果 没有 任何 影响 , 这 又 是 怎么 回 事 
呢 ? 之 所 以 会 出 现 这 种 情况 , 主要 原因 在 于 采集 数据 的 样本 和 我 们 针对 变 
量 使 用 的 粒度 级 别 。 











































































































5.3 FERFE 











假设 你 是 一 个 病人 ， 正 要 从 两 名 医生 中 为 自己 挑选 一 名 医生 。 对 于 
SABA, A (Alice) 医生 治疗 时 的 病人 死亡 率 为 40%， 而 B (Betty ) 
医生 治疗 时 的 病人 死亡 率 为 10%。 如 果 只 根据 上 述 信息 ,， 那 你 可 能 会 
倾向 于 选择 Betty 来 为 你 治疗 ， 但 你 其 实 并 没有 足够 的 信息 来 支持 你 的 
选择 。 

可 能 对 于 每 一 个 具体 的 病人 来 说 ,虽然 Alice 的 病人 总 体 死亡 率 更 高 ， 
但 是 她 的 治疗 效果 却 更 好 。 病 人 并 不 是 随机 被 分 给 Alice 和 Betty 的 ， 有 可 
能 是 其 他 医护 人 员 推 荐 过 来 的 , 也 可 能 是 因为 朋友 、 医 评 网 站 或 广告 上 的 
推荐 而 来 的 。 所 以 ， 如 果 Alice 精湛 的 医术 吸引 来 的 是 那些 病情 最 严重 并 
且 最 难 治疗 的 病人 ， 那 么 即便 她 是 一 名 比 Betty 更 好 的 医生 ， 她 的 病人 的 
总 体 死 亡 率 也 会 很 不 乐观 。 

这 件 事 的 有 趣 之 处 在 于 ， 我 们 不 仅 能 找到 一 个 错误 的 因果 关系 ， 还 
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果 关 系 简 易 入 门 





能 找到 与 真正 的 关系 正好 相反 的 关系 。 比 如 我 们 发 现 Alice 的 治疗 结果 比 
较 糟糕 , 但 实际 上 她 的 治疗 效果 是 更 好 的 那个 。 如 果 我 们 考察 的 数据 不 是 
来 自 于 随机 的 试验 (病人 被 随机 分 配 到 不 同 的 治疗 小 组 中 去 )， 那 么 同样 
的 情况 也 可 能 会 出 现在 考察 药品 疗效 的 对 比 实验 当中 ( 我 们 将 在 第 7 章 进 
一 步 讨 论 ) 但是， 这 个 实验 在 哪些 病人 服用 哪 一 种 药 的 问题 上 可 能 会 存 
在 偏差 ,要 想 解决 这 个 问题 ,只 能 随机 将 病人 分 配 到 不 同 的 治疗 小 组 中 去 。 
比如 说 ， 如 果 每 一 个 恶性 肿瘤 患者 都 采用 A 治疗 方案 ， 而 那些 更 加 容易 
治疗 的 病人 都 采用 B 治疗 方案 ,那么 由 于 接受 A 治疗 方案 的 病人 病情 更 
加 严重 ， 所 以 A 治疗 方案 的 治疗 效果 肯定 要 更 糟糕 一 些 。 选 择 偏差 是 导 
致 我 们 难以 从 观察 数据 中 进行 推理 的 原因 之 一 -我 们 可 能 会 发 现 那些 坚持 
锻炼 的 人 比 那 些 不 爱 运 动 的 人 更 加 长 寿 , 但 这 也 可 能 只 是 因为 那些 坚持 锻 
炼 的 人 比 那 些 没有 锻炼 的 或 者 不 能 锻炼 的 人 更 加 健康 而 已 。 

因果 关系 可 能 会 消失 ， 或 者 表面 上 好 像 发生 了 逆转 ， 这 种 奇怪 的 现 
象 就 是 众所周知 的 辛普森 悖 论 。” 辛普森 描述 了 这 种 情况 中 的 数据 具备 的 
一 些 数 学 特征 , 并 举 了 一 个 例子 来 进行 说 明 : 当 我 们 分 别 考察 男性 参与 者 
和 女性 参与 者 时 , 治疗 方案 是 有 效 的 ; 但 当 我 们 将 所 有 参与 者 作为 一 个 整 
体 来 考察 时 , 治疗 方案 似乎 没有 任何 效果 。 还 有 一 些 研究 人 员 向 我 们 演示 
了 比 这 更 加 极端 的 情况 : 新 的 治疗 方案 对 男性 参与 者 和 女性 参与 者 的 治疗 
效果 都 更 好 , 但 在 整个 参与 者 群体 中 却 出 现 了 更 多 的 死亡 病例 “( 如 图 5-6 
所 示 )。 还 有 一 些 著名 的 案例 ， 比 如 伯克利 大 学 的 研究 生 录取 率 ( 由 于 女 
学 生 申 报 的 院 系 更 具 竞争 性 ， 所 以 录取 率 似 乎 要 低 一 些 ) “和 佛罗里达 州 
的 死刑 率 ( 被告 的 种 族 似 乎 是 影响 判决 的 一 个 因素 , 但 实际 上 影响 判决 的 
因素 是 受害 者 的 种 族 )。” 
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本 死亡 率 
a 死亡 率 
存活 率 存活 率 存活 率 
A B A B A B 
(a) 男性 和 女性 (b) 男性 (c) 女性 
图 5-6 辛普森 悖 论 演示 图 。 图 中 A 方案 在 男性 和 女性 组 中 的 效果 都 要 

















更 好 一 些 , 但 B 方 案 在 整个 群体 组 中 的 治疗 效果 似乎 更 好 





在 这 些 辛普森 悖 论 的 案例 中 ， 我 们 可 以 通过 增加 更 多 信息 来 解释 这 
些 虚 假 的 关系 ,具体 来 说 就 是 考察 更 小 的 群体 。 就 那 两 个 医生 而 言 , 一 旦 
我 们 去 考察 一 些 健康 状况 相同 或 者 风险 级 别 相 同 的 病人 ， 就 能 发 现 其 实 
Alice 的 治疗 效果 更 好 ; 就 研究 生 录取 率 而 言 ， 可 以 分 院 系 进行 考察 ; 就 
死刑 率 而 言 , 可 以 按照 受害 者 的 种 族 来 进行 考察 。 这 些 实际 上 就 是 考察 数 
据 问 题 时 使 用 的 粒度 级 别 。 我 们 正在 观察 的 概率 实际 上 反映 了 概率 青 后 的 
潜在 关系 , 知道 这 一 点 有 助 于 我 们 从 数据 中 找到 那些 概率 关系 。 在 制定 政 
策 时 , 我 们 需要 知道 某 个 群体 中 出 现 的 概率 是 否 也 适用 于 这 个 政策 针对 的 
群体 。 

问题 的 关键 在 于 ， 我 们 要 确定 何 时 以 及 如 何 划分 手中 的 数据 ， 因 为 
考察 越 来 越 细 化 的 子 数据 集 并 不 能 够 解决 所 有 问题 。 整 体 数 据 集中 不 存在 
的 、 与 直觉 相悖 的 结果 可 能 会 出 现在 子 数据 集 当 中 ,而 将 这 个 数据 进一步 
细 分 可 能 会 导致 这 些 结果 再 次 逆转 。 在 那个 新 药 案 例 中 , 这 种 药 在 分 别 治 
疗 男性 参与 者 和 女性 参与 者 的 时 候 效 果 更 好 ， 但 在 治疗 整个 参与 者 群体 
时 ， 治 疗效 果 似乎 更 糟糕 。 那 么 ,我 们 也 许 应 该 相信 这 种 药 是 有 效 的 。 这 
一 点 有 些 争议 , 因为 辛普森 自己 说 过 这 种 新 药 “ 既 然 对 男性 参与 者 群体 和 
女性 参与 者 群体 都 有 效 ， 那 我 们 就 不 应 该 认为 它 是 对 全 人 类 毫 无 价值 的 
药物 "。” 但 是 ， 辛 普 森 还 举 了 一 个 这 种 解释 不 成 立 的 例子 。 要 想 找 到 作 



























































































































































122 ， 别 拿 相关 当 因 果 ! 因果 关系 简易 入 门 



































为 区 分 条 件 的 正确 变量 集 , 首先 要 对 事件 之 间 的 因果 结构 有 所 了 解 , 而 如 
果 我 们 研究 变量 集 的 目的 就 是 掌握 因果 结构 ， 那 就 麻烦 了 。™ 
这 是 很 多 因果 关系 问题 的 关键 所 在 。 我 们 绝 不 可 能 完全 脱离 因果 关 
系 的 背景 知识 而 去 单独 谈论 因果 关系 问题 ,我们 必须 利用 这 种 背景 知识 来 
选择 数据 分 析 的 对 象 ， 并 且 用 它 来 解释 数据 分 析 的 结果 。 





















































5.4 QR 
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外 面 再 热 一 点 的 话 , 我 一 定 会 跑 得 慢 一 些 。 这 两 句 话 正在 努力 指出 一 个 让 
事件 这 样 发 生 而 不 是 那样 发 生 的 突出 因素 。 我 们 经 常会 从 与 事实 相反 的 角 
度 来 谈论 因果 关系 。 当 然 , 这 一 点 我 们 也 无 法 肯定 一 一 即使 天 气 是 完美 的 ， 
我 们 也 可 能 在 跑步 的 时 候 贫 了 气 , BCR AAA POR RES. 但 我 想 说 的 
是 , 在 其 他 条 件 都 不 变 的 情况 下 ， 如 果 天 气 再 好 点 的 话 , 我 可 能 会 跑 得 更 
快 一 些 。 

这 些 话 指出 了 一 种 必要 性 或 一 种 造成 差异 的 因素 , 而 这 种 因素 或 必要 
性 并 不 包含 任何 规律 。 通 过 休 席 关于 事件 发 生 序列 的 规律 性 理论 ， 我 们 仅 
能 知道 有 些 事件 经 常 一 起 出 现 。 而 我 们 现在 要 试图 阐明 的 是 , 在 某 种 意义 
E, 要 想 让 这 些 事件 按照 它们 已 经 发 生 过 的 方式 再 次 出 现 , 是 离 不 开导 致 
这 些 事 件 发 生 的 那个 原因 的 ; 如 果 这 个 原因 没有 出 现 , 那么 这 些 事件 发 9 
的 方式 就 会 大 不 相同 了 。 这 就 叫 反 事 实 推理 。 大 致 来 说 , 反 事实 推理 就 是 
一 个 这 种 形式 的 推断 : 如 果 A 成 立 的 话 ，C 也 会 成 立 。 例 如 : 如 果 我 涂 了 
防晒 霜 的 话 ， 那 我 就 不 会 被 晒 伤 了 。 

有 趣 的 是 ， 休 议 的 理论 可 以 让 人 们 同时 运用 规律 法 和 反 事 实 推理 法 
来 研究 因果 关系 。 休 席 曾 这 样 写 道 :“ 第 一 个 事物 出 现在 第 二 个 事物 之 
前 ， 而 且 所 有 与 第 一 个 事物 类 似 的 事物 出 现 之 后 ， 都 会 出 现 与 第 二 个 事 
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物 类 似 的 事物 ( 规律 性 的 定义 ),” 接 着 他 又 写 道 :“ 换 句 话 说 ,如 果 第 一 
个 事物 不 出 现 的 话 , 那么 第 二 个 事物 也 永远 都 不 会 出 现 ( 反 事实 推理 的 























定义 ) ”2 从 休 资 的 文章 中 可 以 看 出 ， 他 似乎 认为 这 两 句 话说 的 是 同一 个 








意思 ， 但 实际 上 由 此 诞生 的 却 是 两 种 不 同 的 因果 研究 方法 。 















































反 事实 推理 法 (在 休 议 的 启发 下 ， 由 David Lewis 正式 提出 ) 的 基础 
Æ, ZANE C 能 够 引起 EE， 那么 有 两 个 条 件 必须 成 立 :， 如 果 C 没有 出 现 
的 话 ， 那 么 卫 也 不 会 出 现 ; 如果 C 出 现 了 的 话 ， 那 么 卫 也 会 出 现 。 比 如 ; 
如 果 我 涂 了 防晒 霜 的 话 , 那 我 就 不 会 被 晒 伤 了 , 而 如 果 我 没有 涂 防 晒 霜 的 
























































话 , 那 我 就 会 被 栖 伤 。 这 两 个 条 件 既 包含 了 必要 性 又 包含 了 充分 性 。 当然 ， 
也 有 概率 性 反 事实 推理 法 ， 但 是 我 们 在 这 里 不 进行 介绍 。” 

我 们 再 回头 看 看 编程 马拉松 的 例子 。 也 许 这 些 程序 员 每 次 喝 了 很 多 
咖啡 之 后 第 二 天 都 会 非常 累 。 也 许 他 们 只 有 效 夜 的 时 候 才 会 喝 很 多 咖啡 。 
不 管 怎样 , 单 赁 这 些 事件 出 现 的 规律 性 , 我 们 就 能 发 现 喝 咖 啡 是 导致 疲劳 





























的 一 个 原因 。 但 是 , 如 果 这 些 程序 员 不 喝 咖 啡 , 他 们 第 二 天 仍然 会 很 累 ( 由 


于 熬夜 所 致 ， 假 设 他 们 在 没有 咖啡 因 刺激 的 情况 下 仍然 能 够 熬夜 )。 如 果 
使 用 反 事实 推理 法 分 析 这 个 案例 , 那么 喝 咖 啡 就 不 再 是 引起 疲劳 的 一 个 原 






































因 了 。 从 理论 上 来 说 , 这 个 方法 让 我 们 能 够 将 那些 可 能 偶然 一 起 发 生 的 











素 和 那些 真正 导致 某 种 结果 的 原因 区 分 开 来 。 
现在 你 可 能 会 想 ， 我 们 如 何 才 能 真正 了 解 将 会 发 生 的 事情 呢 ? 这 就 








这 
是 法 律 推理 ( 我 们 将 在 后 面 探讨 这 个 话题 ) 的 核心 难题 之 一 : 我 们 能 和 否 肯 
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ji 的 车 没有 突然 转向 的 话 ， 你 就 不 会 急 刹 车 ， 也 就 不 会 





























被 后 面 的 车 撞 了 呢 ? 也 有 可 能 你 后 面 的 驾驶 员 注意 力 不 集 中 或 者 身体 上 
有 缺陷， 无 论 如 何 都 会 撞 上 你 的 车 呢 ? 

与 事实 相反 的 事情 通常 是 指 单 一 的 事件 而 不 是 普遍 的 特性 ( 这 些 将 在 
第 8 章 详细 讨论 )。 要 想 让 这 些 单一 的 事件 成 为 我 们 可 以 正式 考察 的 事物 ， 


























可 以 将 这 些 事件 与 模型 联系 在 一 起 。 如 果 我 们 能 够 用 一 系列 等 式 来 表 
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个 事件 系统 , 就 可 以 直接 验证 如 果 我 们 研究 的 原因 不 成 立 的 话 , 那 我 们 所 
关心 的 结果 是 否 依 然 会 出 现 。 比 如 说 ,如 果 某 种 毒药 是 绝对 致命 的 , 那么 











只 要 吃 了 这 个 毒药 就 一 定 会 死 。 














当然 ,很 多 原因 都 能 导致 死亡 , 所 以 我 们 


可 以 给 其 他 原因 设 定 一 个 值 〈 真 或 假 )。 然 后 ,我 们 就 能 看 到 如 果 我 们 改 
变 毒 药 的 值 ( 真 或 假 ) 会 导致 什么 样 的 结果 。 如 果 我 们 将 毒药 的 值 设 定 为 





假 ,那么 其 他 变量 是 否 足以 让 死亡 的 值 保 持 为 真 呢 ? 这 就 是 结构 方程 模型 


背后 的 基本 理念 。 在 这 个 模型 中 
子 集中 的 一 个 函数 。? 












































, 每 一 个 变量 都 是 系统 中 其 他 变量 的 某 个 














然而 ,这 种 反 事 实 推理 法 也 不 是 完美 无 缺 的 。 想 想 拉 斯 普 金 案 吧 1 


传说 , 他 曾 在 吃 蛋 糕 时 喝 下 了 有 




















剧 毒 的 葡萄 酒 ( 酒 里 所 含 的 氰 化 物 的 量 足 





以 毒 死 五 个 壮 汉 )， 但 并 没有 被 毒 死 。 结 果 有 人 朝 他 背后 开 了 一 枪 ， 而 他 
再 次 活 了 下 来 ,接着 又 中 了 枪 。 最 后 ,他 被 绑 起 来 扔 进 了 冰河 之 中 , 但 他 




















又 自己 解 开 了 绳索 ! 不 过 , 最 后 拉 斯 普 金 还 是 被 洽 死 了 。 那么 , 他 的 死因 





























是 什么 呢 ? 我们 能 否 肯 定 地 说 如 果 他 没有 被 下 毒 也 依然 会 死 呢 ?” 有 可 能 
是 这 个 毒药 过 了 段 时 间 才 发 作 呢 ? 或 者 可 能 是 这 个 毒药 让 他 没有 力气 从 














河 里 游 上 岸 呢 ? 同 理 , 中 枪 也 可 能 会 起 同样 的 作用 ( 以 其 他 方式 促成 了 他 


的 死亡 )。 


这 个 例子 里 出 现 了 好 几 个 原因 ， 而 且 其 中 任何 一 个 原因 都 可 能 导致 
某 种 结果 , 像 这 样 的 例子 很 难 进行 反 事实 推理 。 这 些 案例 都 是 超 定 的 实例 。 
超 定 就 是 多 余 因 果 关 系 的 对 称 形式 ， 比 如 在 执行 枪决 的 过 程 中 , 犯人 被 行 
























































刑 队 的 多 名 成 员 射 中 ; 一 个 病人 同时 服用 的 两 种 药物 都 能 引起 某 些 副 作 
Ho 在 这 两 个 例子 中 , 如 果 其 中 一 个 原因 没有 发 生 ( 某 一 个 队员 没有 开 枪 ， 
或 者 病人 没有 服用 某 一 种 药 )， 结 果 依然 会 发 生 。 从 反 事 实 推理 的 角度 来 


看 ， 这 个 结果 并 不 依赖 于 每 一 个 原因 。 我 们 也 可 以 放松 这 个 条 件 说 也 许 
































结果 依然 会 出 现 , 不 过 可 能 会 有 


一 点 不 同 而 已 。 也 许 副作用 出 现 的 时 间 可 


能 会 晚 一 些 ， 或 者 没有 那么 严重 。* 
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在 超 定 的 案例 中 存在 一 个 问题 ， 就 是 我 们 没有 找到 任何 原因 。 但 从 
概念 上 来 讲 , 我 们 本 来 也 无 法 真正 确定 某 个 具体 的 原因 , 而 且 每 个 原因 似 
乎 都 在 某 种 意义 上 合理 地 导致 了 某 个 结果 的 出 现 。 我 们 再 来 看 看 这 种 情 
况 : 有 两 个 原因 同时 存在 , 但 是 只 有 一 个 原因 随时 都 能 起 作用 , 另 一 个 原 
只 是 一 个 备 胎 , 只 有 在 第 一 个 原因 不 起 作用 的 情况 下 才 会 起 作用 。 假设 
行刑 队 的 每 一 个 成 员 只 有 在 前 一 个 队员 开 枪 后 没有 杀 死 内 犯 的 情况 下 才 
会 开 枪 。 生物 学 中 经 常会 出 现 这 种 类 型 的 备 胎 机 制 ， 比 如 有 两 个 基因 能 够 
产生 同样 的 显 性 特征 ， 但 是 其 中 任何 一 个 基因 都 能 抑制 另 一 个 基因 的 作 
用 ， 即 基因 A 抑制 基因 B， 以 便 只 有 在 基因 A 不 起 作用 的 情况 下 基因 B 
才 会 起 作用 。 所 以 , 显 性 特征 p 并 不 依赖 于 基因 A, 因为 如 果 基 因 A 不 起 
作用 , 基因 B 就 会 起 作用 。 这 个 案例 比 前 一 个 案例 更 麻烦 ,因为 我 们 虽然 
可 以 通过 直觉 挑选 出 一 个 导致 某 种 结果 的 因素 , 但 是 无 法 通过 反 事 实 推理 
法 找到 这 个 因素 。 在 这 个 案例 中 , 有 两 个 或 更 多 可 能 的 原因 都 能 导致 某 种 
结果 ， 但 实际 出 现 的 只 有 一 个 原因 ， 这 种 类 型 的 问题 就 叫 优先 权 问题 。 

人 们 经 常会 区 分 “ 早 到 的 优先 权 ” 和 “迟到 的 优先 权 ”。 在 早 到 的 优 
先 权 案例 中 ,只 有 一 个 原因 会 出 现 并 完成 整个 过 程 ， 而 另 一 个 原因 在 第 
一 个 原因 没有 起 作用 的 情况 下 会 起 作用 的 第 二 个 原因 ) 则 处 于 被 抑制 的 
状态 。 基 因 备 胎 案例 正 是 这 种 情况 。 在 迟到 的 优先 权 案例 中 , 两 个 原因 都 
会 出 现 ， 但 是 导致 某 种 结果 的 只 有 一 个 原因 。 行 刑 队 案 例 正 是 这 种 情况 : 
有 一 颗 子 弹 会 在 其 他 子弹 之 前 击 中 犯人 , 并 在 其 他 子弹 击 中 犯人 之 前 让 犯 
SEAT 

在 反 事实 推理 方面 ， 因 果 关 系 的 具体 结构 还 存在 一 些 其 他 问题 ， 万 
其 对 于 那些 从 反 事 实 依赖 链 的 角度 来 思考 因果 关系 的 人 来 说 更 是 如 此 。 如 
果 存 在 一 个 反 事 实 因果 关系 依赖 链 的 话 , 那么 据说 这 个 依赖 链 中 的 第 一 个 
组 成 部 分 就 是 引起 最 后 一 个 组 成 部 分 的 原因 。 

比如 说 ,《 老 爸 老 妈 罗 曼 史 》 中 有 一 集 讲 的 是 两 个 人 在 争执 到 底 是 谁 
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果 关 系 简 易 入 门 





害 他 们 错过 了 航班 。Robin 觉得 是 Barney 的 错 ， 因 为 Barney 在 去 见 他 的 
路 上 在 地 铁 站 翻 了 一 个 旋转 栅 门 , 所 以 导致 Ted 被 开 了 罚单 ,并且 不 得 不 
在 飞机 起 飞 的 那天 早上 去 法 庭 受 审 。 后 来 Ted 分 析 了 一 个 复杂 的 事件 链 
(其 中 包括 Robin 导致 Marshall 脚趾 受伤 的 事 ), 然 后 觉得 这 是 Robin 的 错 ， 
因为 Barney 之 所 以 要 跑马 拉 松 ( 因此 他 在 地 铁 站 才 需 要 帮助 ) 完全 是 由 
Robin 导致 的 。 而 Robin 则 觉得 错 在 Lily， 因 为 她 之 所 以 会 出 现在 Lily 家 
(去 睡 一 觉 ) 并 导致 Marshall 受到 惊吓 然后 伤 了 脚趾， 是 因为 她 要 排队 购 















































买 特价 婚纱 。 最 后 ， 故 事 的 高 潮 是 Ted 认为 这 件 事 归 根 结 底 是 他 的 责任 。 





为 他 发 现 了 一 枚 罕见 的 幸运 便士 ， 然 后 他 和 Robin 把 这 枚 硬币 卖 掉 了 ， 








用 卖 来 的 钱 去 婚纱 店 对 面 严 了 热狗 。 在 这 一 集中 ， 件 事 都 有 一 个 与 事 











实 相 反 的 假设 : 如 果 Ted 没有 去 法 庭 的 话 ， 他 就 不 会 错过 航班 ; 如 果 
Marshall 去 跑马 拉 松 的 话 ，Barney 就 不 会 需要 Robin 的 帮助 ; 如 果 Robin 




















没有 去 婚纱 店 的 话 ，Marshall 的 脚趾 就 不 会 断 ; 而 如 果 Ted 没有 捡 到 硬币 


的 话 ， 他 们 就 不 会 知道 婚纱 店 在 促销 。” 








在 这 种 案例 中 ,不 同 因果 理论 对 真正 的 原因 有 着 不 同 的 观点 。 有 些 

























































































理论 寻找 的 是 引发 这 一 系列 事件 并 导致 某 种 结果 的 最 早 的 因素 , 还 有 些 理 
论 则 想 要 找到 最 直接 的 原因 。 这 些 理论 存在 的 问题 是 , 我 们 可 能 会 不 断 找 
到 距离 实际 结果 越 来 越 远 的 事件 。 然而 , 还 有 更 加 麻烦 的 情况 : 茶 个 事件 
通常 会 阻止 某 种 结果 的 出 现 , 但 又 会 让 这 种 结果 以 另 一 种 方式 出 现 , 从 而 








产生 一 个 表面 上 的 依赖 链 。 比如, 有 一 个 见义勇为 的 人 在 一 列 火车 前 面 救 
了 一 个 摔 倒 在 铁轨 上 的 人 , 但 这 个 人 后 来 却 在 跳伞 时 摔 死 了 。 要 是 他 在 铁 








i 





轨 上 没有 被 救 的 话 他 就 不 会 去 跳伞 ,从 反 事 实 推理 


























的 角度 来 看 , 他 的 死亡 








也 就 不 会 由 踏 伞 来 决定 ,因为 跳伞 是 由 他 被 救 这 一 事件 来 决定 的 。 这 样 一 














来 , 这 位 见义勇为 的 人 似乎 反倒 成 了 导致 他 死亡 的 














因素 。 在 第 8 章 , 我 们 


将 研究 人 们 在 法 律 案 件 中 是 如 何 处 理 这 类 问题 的 。 毕 竞 , 如 果 一 个 被 救 的 
人 后 来 酒 芍 并 撞 死 了 人 , 我 们 肯定 不 想 让 那个 救 人 的 人 来 承担 责任 。 即 便 
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是 这 个 救 人 者 的 行为 让 这 场 交 通 事故 成 为 可 能 ， 也 不 应 该 让 他 承担 责任 。 
尽管 其 中 可 能 存在 因果 关系 , 但 这 还 不 足以 让 救 人 者 承担 法 律 责任 。 要 想 
让 救 人 者 承担 法 律 责任 , 还 需要 一 个 此 案例 中 并 不 存在 的 条 件 : 后 果 的 可 
预见 性 。 


























5.5 观察 法 的 局 限 性 


我 们 再 回头 想 想 本 章 开头 提 到 的 那个 统计 数据 ， 它 声称 有 些 因素 能 
让 人 们 有 98% 的 可 能 不 会 陷入 贫困 境地 ,现在 你 应 该 知道 为 什么 从 这 个 数 
据 中 去 推理 因果 关系 会 那么 难 了 。 当 只 有 观察 数据 时 , 我 们 永远 都 无 法 确 
定 是 否 存在 隐藏 的 共同 原因 ， 从 而 导致 了 一 些 表 面 上 的 因果 关系 。 比 如 ， 
我 们 可 能 会 发 现 青 少年 时 期 玩 暴 力 的 电子 游戏 和 成 年 后 成 为 一 个 暴力 的 
人 之 间 存 在 相关 性 , 但 是 青少年 时 期 玩 暴 力 的 电子 游戏 可 能 完全 是 环境 和 
基因 因素 导致 的 。 同 样 ， 当 我 们 只 能 观察 而 不 能 干预 时 ， 就 必须 将 选择 仿 
差 考 虑 进来 。 比 如 说 , 我 们 假设 参加 锻炼 的 人 对 疼痛 的 忍耐 力 比 不 锻炼 的 
人 高 。 这 并 不 能 告诉 我 们 锻炼 是 否 真 的 能 够 提高 人 们 对 疼痛 的 忍耐 力 , 也 
不 能 告诉 我 们 这 些 坚持 锻炼 的 人 是 否 都 是 忍耐 力 高 的 人 , 因为 他 们 更 能 适 
应 不 适 感 。 但 是 , 观察 却 能 为 我 们 以 后 的 实验 研究 或 探索 因果 机 制 (原因 
是 如 何 导致 某 个 结果 的 ) 背景 知识 的 活动 提供 一 个 切入 点 。 
































































































































注释 














1. 在 原文 中 ， 这 个 数据 实际 上 是 这 样 说 的 :“ 那 些 完成 了 高 中 学 业 、 拥 有 全 职 
工作 并 且 在 婚 后 才 生 孩子 的 人 几乎 无 一 例外 都 成 了 中 产 阶 级 。 在 这 和 群 人 
H, RA 2% 的 人 成 了 贫困 人 口 。” (Haskins 和 Sawhill, 2009, 9), 

2. 有 证 据 表明 ， 如 果 人 们 遇 到 的 主要 障碍 是 没 钱 ， 那 么 直接 给 人 们 现金 可 能 
会 成 为 一 个 有 效 的 干预 措施 。 关 于 有 条 件 现金 转移 支付 和 无 条 件 现金 转移 
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支付 项 目的 效果 对 比 ,， 参见 Baird 等 (2013 ); 关于 无 条 件 现金 转移 支付 项 

目的 回顾 ， 参 见 Haushofer 和 Shapiro (2013 )。 

3. 这 是 一 项 正在 进行 的 研究 。 该 研究 追踪 记录 了 弗 雷 明 汉 好 几 代 居民 的 健康 

4. Mill (1843 )。 

5， 在 计算 方法 领域 ， 充 分 性 还 有 另 一 个 意思 ， 指 数据 中 包括 哪些 变量 

6， 由 于 人 们 假设 的 运行 机 制 ( 即 原因 导致 结果 的 方式 ) 不 同 ， 可 能 会 出 现 具 
有 决定 性 特征 的 关系 。 

7. Corrao “ (2000 )。 

8. Nieman ( 1994 ), 

9. Mostofsky F (2012 )。 

10. Snow (1855 )。 

11. Snow (1854 )。 

12. Snow (1854 )。 

13. Rothman (1976 )。 

14. Mackie ( 1974 )。 

15. Carey (2013 )。 

16. Dwyer (2013 )。 

17. Carey (2012 )。 

18. 想 要 了 解 关 于 统计 功效 的 基本 信息 ， 参 见 〈Vickers，2010 )。 

19. 不 同 国家 的 比例 有 细微 的 变化 ， 但 已 经 有 很 多 大 规模 的 研究 使 用 了 SAH 
登记 数据 。 这 些 研 究 也 给 出 了 类 似 的 数字 (Korja 等 ，2013; de Rooij 等 ， 
2007; Sandvei 等 ，2011 )。 

20. Cherry 和 Oldford (2003 ) 提出 了 用 来 表示 概率 的 Eikosogram 图 。 

21. Maurage 等 (2013 )。 

22. 想 要 了 解 更 多 关于 筛选 的 信息 ， 参 见 Reichenbach (1956 )。 

23. 在 这 些小 组 相互 作用 的 基础 之 上 ， 可 能 会 出 现 似 乎 矛盾 的 结论 。 人 们 一 般 
认为 是 辛普森 (1951) 首次 普及 了 这 个 似乎 矛盾 的 结论 。 然 而 ， 在 辛普森 
之 前 ，Yule (1903) 也 曾 描述 过 这 一 现象 。 所 以 ， 有 时 这 一 悖 论 也 称 为 
Yule-Simpson 悖 论 。 这 一 悖 论 的 发 现 也 可 归功 于 Pearson 等 (1899 )。 他 们 
和 Yule 一 起 工作 过 。 

24. Baker 和 Kramer (2001 )。 

25. Bickel 等 ( 1975 )。 

26. Radelet 和 Pierce ( 1991 )。 
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27. Simpson ( 1951 )，241。 

28. 想 要 了 解 更 多 关于 辛普森 悖 论 的 争论 以 及 各 种 试图 解决 辛普森 悖 论 的 方 
YE, Bl Hernan 等 (2011 ); Pearl ( 2014 )。 

29. Hume (1739), 172. 

30. 想 要 了 解 更 多 这 方面 的 信息 ， 参 见 Lewis ( 1986b )。 

31. 想 要 了 解 更 多 关于 结构 方程 和 反 事 实 推理 的 内 容 ， 参 见 Pearl (2000 ); 
Woodward (2005 )。 

32. Lewis ( 2000 ) 后 来 修改 了 他 的 反 事实 推理 理论 ， 以 便 将 结果 的 出 现 方式 考 
虑 进来 ， 以 及 在 结果 出 现 的 事实 不 变 的 情况 下 ， 结 果 出 现 的 方式 可 能 也 会 
不 一 样 。 

33. Rhonheimer 和 Fryman (2007 ). 





















































第 6 前” 计算 法 


如 何 自动 实现 寻找 原因 的 过 程 ? 


哪些 药 一 起 服用 会 产生 不 良 反应 ? 


针对 这 个 问题 ， 用 随机 试验 来 测试 药品 并 不 能 给 我 们 提供 多 少 信息 ， 





























因为 这 些 试验 往往 会 避免 让 参与 者 同时 服用 多 种 药物 。 虽然 我 们 可 以 用 模 
拟 实验 来 预测 药物 之 间 的 相互 作用 , 但 是 这 样 的 实验 需要 有 大 量 的 背景 

识 才 能 完成 ,我 们 也 可 以 用 实验 的 方法 对 一 些 药物 组 合 之 间 的 相互 作用 进 
行 测 试 , 但 考虑 到 这 种 实验 需要 的 成 本 和 时 间 , 它 可 能 只 适用 于 少数 儿 种 


























可 能 的 药物 组 合 。 更 糟糕 的 是 

















， 在 数 百 万 可 能 的 药物 组 合 中 ， 只 有 少数 几 





个 组 合 的 药物 之 间 可 能 会 出 现 严重 的 相互 反应 , 而 且 这 种 反应 可 能 只 会 在 





某 些 人 群 中 出 现 。 








一 种 药物 上 市 之 后 ,一 些 疑 似 不 良 反 应 的 事件 会 被 病人 、 制 药 公 司 
和 医疗 服务 机 构 报告 给 食品 及 药品 管理 局 (FDA )， 并 被 输入 数据 库 。 








所 以 ,如果 你 服用 了 一 种 抗 过 




















敏 药物 ， 几 天 后 心脏 病 发 作 了 ,那么 你 或 者 








你 的 临床 医师 就 可 以 把 这 一 情况 报告 给 FDA。 当 然 ， 这 些 报告 里 所 说 的 
情况 通常 都 是 未 经 证 实 的 。 可 能 某 个 人 的 心脏 病 发 作 实际 上 是 与 药物 无 关 
的 血块 引起 的 , 但 由 于 最 近 有 新 闻 报 道 说 出 现 了 很 多 起 该 药物 引发 心脏 病 









































的 事件 , 因此 将 这 个 人 的 心脏 ; 








两 发 作 解 释 为 该 药物 引发 的 不 良 反应 似乎 就 


很 合理 了 。 很 多 情况 都 可 能 会 导致 数据 出 现 虚 假 的 因果 关系 。 例 如 ， 病 
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人 身上 可 能 还 有 其 他 疾病 引发 了 心脏 病 ( 比如 未 诊断 出 的 糖尿 病 )， 这 个 





数据 本 身 也 可 能 会 出 








问题 ( 比如 样本 被 污染 了 或 者 症状 被 误诊 了 )， 而 且 








事件 发 生 的 顺序 可 能 并 不 是 这 样 的 〈 比 如 实验 检测 发 现 血 糖 升 高 了 ， 但 是 


血糖 升 高 是 在 服药 之 前 发 9 











E 的 )。 很 多 真正 的 不 良 反应 可 能 并 未 报告 给 











FDA, 因为 人 们 可 能 认为 这 些 不 良 反应 并 不 是 服药 引起 的 , 也 可 能 是 因为 
病人 在 出 现 不 良 反 应 之 后 并 没有 去 看 医生 , 而 且 自 己 也 没有 将 这 个 不 良 反 


应 报告 给 FDA. 

















即便 有 些 报告 所 说 的 情况 是 错误 的 ， 它 们 仍然 可 以 帮助 我 们 形成 新 
的 有 待 检验 的 假设 。 如 果 我 们 想 要 通过 实验 来 验证 这 些 不 良 反 应 ， 比 如 让 
一 组 病人 服用 各 种 药物 组 合 , 或 者 让 每 个 病人 分 别 服 用 每 种 药物 , 那 我 们 
可 能 要 耽误 很 长 时 间 才 能 找到 这 些 药物 之 间 的 相互 作用 , 从 而 导致 更 多 病 
人 可 能 出 现 药 物 不 良 反 应 。 相 反 ， 如 果 使 用 男 一 组 来 自 医院 的 观察 数据 ， 














我 们 就 能 准确 地 知道 病人 服 



























































] 某 种 药物 组 合 后 会 出 现 什么 情况 。 斯 坦 福 大 





学 的 一 个 研究 团队 正 是 这 样 做 的 。 他 们 使 用 的 数据 来 自 于 FDA 的 不 良 反 
应 数据 库 ， 发 现 同时 服用 某 个 降低 胆固醇 的 药物 和 抗 抑郁 剂 ( 分别 是 普 伐 
他 洒 和 帕 罗 西 汀 ) 可 能 会 导致 血糖 升 高 。 然 后 ,他 们 又 通过 医院 的 记录 比 
较 了 分 别 服用 这 两 种 药物 和 同时 服用 这 两 种 药物 的 病人 的 实验 室 检测 结 
果 , 发 现 病人 在 同时 服用 这 两 种 药物 之 后 , 血糖 升 高 的 值 比 其 他 病人 要 大 








得 多 。 



































当然 ， 我 们 无 法 确定 病人 有 没有 服用 医院 给 他 们 开 的 药 ， 也 无 法 确 
定 同 时 服用 两 种 药物 的 病人 和 其 他 病人 有 没有 什么 不 同 。 尽 管 这 种 类 型 的 





数据 存在 很 多 局 限 怕 
的 结果 都 是 一 样 的 ， 














E, 但 研究 人 员 使 


























月 了 三 家 医院 的 数据 进行 验证 , 得 出 











还 通过 小 白鼠 的 实验 进一步 验证 了 这 一 结果 。” 


在 这 项 研究 中 ， 研 究 人 员 发 现 了 两 个 相互 作用 的 药物 ， 但 他 们 一 开 

















始 并 未 假设 这 两 种 药物 可 能 会 相互 作用 ， 而 是 从 数据 中 发 现 了 这 个 假设 。 




















与 之 相反 的 是 , 我们 目前 所 考察 过 的 所 有 研究 都 是 从 某 个 具体 的 因果 假设 








132 ， 别 拿 相 关 当 因果 ! 
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出 发 , 然后 再 对 这 个 假设 进行 评 佑 ， 比 如 糖 吃 多 了 是 否 会 导致 糖尿 病 这 类 


研究 。 











但 是 ， 倘 若 我 们 并 不 清楚 导致 各 种 关系 成 立 的 因素 是 什么 ， 
院 的 再 入 院 率 为 什么 会 上 升 , 或 者 是 什么 因素 让 人 们 访问 各 个 网 站 的 , AB 


么 我 们 要 从 网 站 上 的 交换 信息 、 医 院 病 历 和 网 络 搜索 等 数据 集 


























的 各 种 方法 进行 结合 ， 


关系 了 , 而 是 通过 对 数据 的 挖掘 同时 揭示 多 种 因果 关系 。 通 








u 








比如 医 


中 了 解 什么 
样 的 信息 呢 ? 要 何 时 了 解 呢 ? 通过 将 计算 能 力 和 从 数据 中 有 效 发 现 原因 


我 们 对 数据 的 分 析 已 经 不 再 是 一 次 只 考察 一 个 因果 
































过 这 些 自 动 化 


的 方法 , 我 们 还 可 以 发 现 很 多 人 们 无 法 直接 观察 到 的 更 加 复杂 的 关系 。 比 


如 , 我 们 可 能 会 发 现 一 个 让 病人 在 中 风 后 恢复 意识 的 、 由 多 个 步 又 (每 个 














步骤 又 包含 多 个 必要 组 成 部 分 ) 组 成 的 事件 序列 。 
本 章 将 考察 从 数据 中 寻找 原因 的 方法 。 首 先 要 讨论 的 是 : 什么 样 的 

















数据 适合 用 来 推理 因 细 
确 的 因果 关系 , 所 以 我 们 将 讨 


























RRA? 并 不 是 每 一 个 数据 集 都 能 让 我 们 推理 出 正 








论 必须 在 因果 推理 中 做 出 什么 样 的 人 


























保证 推理 出 的 因果 关系 是 正 硼 
可 以 得 出 什么 样 的 结论 。 虽然 推理 因果 关系 的 方法 有 很 多 , 但 我 从 
图 找到 一 个 模型 来 对 数据 进行 解释 的 方法 




















主要 是 这 两 种 类 型 的 方法 : 试 















































Biz (以 


的 )， 以 及 在 这 些 假设 不 成 立 的 时 候 ， 我 们 


] 考 察 的 


(本质 上 就 是 同时 了 解数 据 中 所 有 的 因果 关系 ), 以 及 重点 对 每 一 个 关系 的 
强度 分 别 进行 评 佑 的 方法 。 最 重要 的 是 , 我 们 要 认识 到 没有 一 种 方法 能 永 
远 胜 过 其 他 方法 。 尽 管 我 们 在 计算 方法 上 已 经 取得 了 巨大 的 进步 , 但 这 仍 











然 是 一 个 还 在 研究 中 上 

















的 领域 ， 








无 法 做 到 完美 而 又 准确 地 推 到 





6.1 假设 














而 且 在 没有 任何 背景 知识 的 情况 下 ， 
E 出 各 种 情况 下 的 因果 关系 。 





























我 们 还 


在 考察 推理 方法 之 前 ， 我 们 还 要 讨论 一 下 使 用 这 些 方法 需要 输入 的 
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内 容 。 这 里 所 说 的 因果 推理 一 般 是 指 先 选择 一 组 被 测 变 量 ( 比如 随时 间 变 
化 的 股票 价格 ), 然后 使 用 一 个 计算 程序 来 找 出 是 哪个 变量 引起 了 哪个 变 
量 (比如 A 股票 价格 的 上 升 引起 了 B 股票 价格 的 上 升 )。 这 可 能 意味 着 我 
们 要 找 出 每 组 股票 之 间 的 关系 的 强度 , 或 者 要 找到 一 个 模型 来 解释 它们 是 
如 何 相互 影响 的 。 这 里 所 说 的 数据 可 能 是 指 随 着 时 间 变 化 的 事件 序列 , 比 
如 一 只 股票 价格 每 天 发 生 的 变化 ， 也 可 能 是 指 某 个 时 间 点 上 的 事件 序列 。 
在 第 二 种 情况 中 , 我 们 考察 的 不 是 随 着 时 间 而 产生 的 变化 , 而 是 各 个 样本 
之 间 的 变化 。 比 如 在 某 个 时 间 点 上 对 一 群 人 进行 调查 , 而 不 是 针对 某 些 个 
体 进 行 长 期 跟踪 调查 。 

不 同 的 研究 方法 假设 出 的 数据 也 略 有 不 同 ， 但 有 些 特征 几乎 对 所 有 
研究 方法 都 是 一 样 的 ， 而 且 这 些 特 征 还 会 影响 我 们 从 数据 中 得 出 的 结论 。 


6.1.1 无 隐藏 的 共同 原因 


一 个 最 重要 且 最 普遍 的 假设 可 能 就 是 我 们 已 经 测量 了 正在 进行 因果 
推理 的 变量 中 的 所 有 共同 原因 。 这 在 图 示 模 型 法 ( 即将 介绍 ) 中 也 被 称 为 
因果 关系 的 充分 性 。 如 果 想 要 从 一 组 变量 中 找 出 原因 , 那么 我 们 必须 确保 
测量 了 这 些 变量 中 的 所 有 共同 原因 。 如 果 咖 啡 因 是 真正 导致 睡眠 不 足 与 心 
率 上 升 的 原因 ( 而 且 这 也 是 睡眠 和 心率 之 间 的 唯一 联系 )， 那 么 如 果 我 们 
不 测量 咖啡 因 的 摄 和 人 量 ， 可 能 就 会 得 出 错误 的 结论 ， 在 咖啡 因 导 致 的 两 
个 结果 ( 睡眠 不 足 和 心率 上 升 ) 之 间 找 到 联系 。 数 据 中 缺少 的 原因 叫 作 潜 
在 变量 。 两 个 或 两 个 以 上 的 变量 之 间 未 测量 到 的 原因 可 能 会 导致 人 们 做 出 
错误 的 推理 , 这 样 的 原因 被 称 为 隐藏 的 共同 原因 或 潜在 的 混杂 因子 , 而 由 
此 导致 的 问题 被 称 为 混杂 ( 在 计算 机 科学 和 哲学 文献 中 更 为 常见 ) 和 遗漏 
变量 偏差 ( 在 统计 学 和 经 济 学 中 更 为 常见 )。 这 是 观察 性 研究 的 主要 局 限 
性 之 一 , 也 是 大 多 数 计算 法 输入 内 容 的 主要 局 限 性 之 一 。 它 不 仅 会 导致 人 
们 在 变量 之 间 发 现 错误 的 联系 ， 还 会 导致 人 们 高 佑 原因 的 强度 。 
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现在 对 上 面 这 个 例子 稍 加 改动 ， 让 咖啡 因 不 仅 能 直接 抑制 睡眠 ， 还 
能 通过 心率 上 升 来 抑制 睡眠 ( 如 图 6-1 所 示 )。 尽 管 心率 上 升 会 引起 睡眠 
减少 , 但 如 果 没 有 测量 咖啡 因 的 摄 入 量 , 我 们 可 能 会 发 现 咖啡 因 的 显著 性 
比 我 们 本 应 发 现 的 显著 性 要 高 一 些 或 低 一 些 。 也 就 是 说 , 因为 咖啡 因 会 导 
致 心率 上 升 ， 所 以 心率 高 可 以 向 我 们 透露 咖啡 因 的 状态 〈 存在 或 者 不 存 
E) 我 们 将 在 第 7 章 考 察 实验 法 是 如 何 通过 随机 化 来 解决 这 个 问题 的 。 
几乎 每 一 个 使 用 观察 数据 的 方法 都 必须 假设 不 存在 隐藏 的 共同 原因 ， 但 
实际 上 我 们 只 有 在 极 少数 的 情况 下 才能 够 保证 确实 不 存在 隐藏 的 共同 











































































































咖啡 因 


> 


心率 一 一 一 一 一 睡眠 
图 6-1 咖啡 因 是 心率 上 升 和 失眠 的 共同 原因 , 但 是 心率 也 会 直接 影 
响 睡眠 






































注意 , 我 们 并 不 一 定 非 要 假设 每 一 个 原因 都 要 测量 到 一 一 我 们 只 需 测 
量 那 些 共 同 的 原因 。 如 图 6-2a 所 示 ， 图 中 咖啡 因 不 仅 引 起 了 睡眠 的 变化 ， 
还 引起 了 心率 的 变化 , 而 白酒 也 同样 引起 了 睡眠 的 变化 。 如 果 没 有 关于 白 
酒 摄 入 量 的 数据 , 那 我 们 将 无 法 找到 引起 睡眠 变化 的 原因 , 但 也 不 会 因此 
i 在 其 他 变量 之 间 找 到 错误 的 关系 。 同 样 , 如 果 咖 啡 对 睡眠 的 影响 是 通过 
一 个 中 间 变 量 引 起 的 , 它们 之 间 的 关系 差不多 是 咖啡 因 引 起 心率 上 升 , 而 
心率 上 升 又 导致 睡眠 减少 (如 图 6-2b 所 示 )， 那 我 们 如 果 不 测量 心率 ,最 
多 只 会 找到 一 个 间接 的 原因 ， 而 不 是 一 个 错误 的 因果 关系 结构 。 因 此 , 并 
不 一 定 非 要 观察 到 因果 关系 链 中 的 每 一 个 环节 。 
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咖啡 因 白酒 me 
“re 
心率 睡眠 睡眠 











(a) 咖啡 因 是 一 个 Veer 
共同 原因 ， 但 白酒 不 是 (b) 因果 关系 链 


图 6-2 即使 没有 测量 白酒 (左边 ) 和 心率 ( 右边 )， 也 不 会 混杂 咖 
啡 因 和 睡眠 之 间 的 关系 






































有 些 计算 法 试图 寻找 什么 时 候 可 能 会 存在 缺失 的 原因 ， 或 者 试图 在 
某 些 情况 下 寻找 这 个 原因 本 身 ， 以 此 来 避免 要 测量 到 所 有 共同 原因 的 假 
设 。 然 而 ,这 一 点 通常 只 有 在 相当 严格 的 条 件 下 才能 做 到 ， 而 且 在 复杂 的 
时 间 序 列 数据 中 难度 会 更 高 。“ 

如 果 我 们 并 不 知道 所 有 的 共同 原因 都 被 测量 到 了 ， 也 不 能 使 用 这 些 
方法 来 找到 这 些 共同 原因 , 又 该 怎么 办 呢 ?” 本 章 将 要 考察 的 图 示 模 型 法 中 
有 一 个 办 法 , 就 是 找到 与 这 个 数据 一 致 的 所 有 可 能 的 模型 , 包括 那些 带 有 
隐藏 变量 的 模型 。 比 如 说 ,如 果 我 们 在 睡眠 和 心率 之 间 发 现 了 一 个 表面 上 
的 因果 关系 ,并且 知道 这 两 个 变量 之 间 可 能 存在 某 些 未 测量 到 的 共同 原 
因 ,那么 一 个 可 能 的 模型 就 会 包含 一 个 ( 能 够 引起 这 两 个 观察 到 的 变量 的 ) 
隐藏 变量 。 这 种 方法 的 好 处 在 于 , 所 有 能 够 解释 这 些 数据 的 模型 之 间 可 能 
会 存在 一 些 共同 的 联系 。 这样 一 来 ,即便 存在 多 种 可 能 的 因果 结构 ,我 们 
依然 能 够 找 出 一 些 可 能 的 联系 。 

人 们 对 因果 推理 结果 的 信心 与 他 们 对 所 有 潜在 原因 的 测量 程度 成 正 
比 , 无 一 例外 。 在 将 来 验证 这 一 结论 的 实验 研究 工作 中 , 我们 根据 观察 数 
据 推 理 出 的 结论 可 以 作为 这 些 研究 工作 的 出 发 点 。 


6.1.2 ”典型 分 布 


除了 要 确保 找到 了 正确 的 变量 集 ,我 们 还 需要 确保 观察 到 的 内 容 反 映 
了 观察 对 象 的 真实 行为 。 从 本 质 上 来 说 ， 如 果 没 有 报警 系统 就 会 导致 抢 动 
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案 的 发 生 , 那么 我 们 的 数据 需要 确保 抢劫 案 的 发 和 
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E 完 全 依赖 于 是 否 安装 


报警 系统 。 我 们 已 经 考察 了 几 个 数据 不 具 代 表 性 的 案例 : 考察 有 限 范 围 内 


的 数据 导致 我 们 发 现 学 习 和 SAT 成 绩 之 间 没有 但 








F 何 相关 性 〈 见 第 3 章 ); 








辛普森 悖 论 表明 , 根据 考察 数据 的 不 同 ( 整体 数据 或 分 别 考察 男性 参与 者 
和 女性 参与 者 的 数据 )， 药 物 和 药 效 之 间 的 因果 关系 会 消失 或 发 生 逆转 


( 见 第 5 章 )。 























我 们 还 考察 过 一 个 案例 ， 这 个 案例 向 我 们 展示 了 各 种 关系 是 如 何 相 


互 抵消 从 而 导致 了 一 个 没有 相关 性 的 因果 关系 的 。 在 第 3 章 中 , 跑步 和 体 


重 下 降 之 间 存 在 两 种 关系 ， 











种 是 跑步 对 体重 下 降 有 积极 影响 ， 另 一 种 是 

















跑步 对 体重 下 降 有 消极 影响 ,因为 跑步 同时 也 会 导致 食欲 的 增加 。 如 果 搜 
集 到 的 数据 分 布 得 不 好 , 我 们 可 能 就 会 发 现 跑步 和 体重 下 降 之 间 没 有 任何 








关系 。 因 果 推 理 取 决 于 真实 的 依赖 性 关系 , 所 以 我 们 通常 要 假设 这 种 类 型 





























的 相互 抵消 是 不 会 发 生 的 。 这 种 假设 通常 被 称 为 忠实 性 原则 , 因为 那些 不 
能 反映 真正 的 潜在 因果 结构 的 数据 在 某 种 意义 上 是 “不 忠实 的 ”。 





有 些 人 认为 这 种 违背 忠实 性 原则 的 现象 并 不 常见 ， 
如 生物 系统 ) 的 结构 方式 就 几乎 确保 了 这 种 现象 一 定 会 发 生 。 当 很 多 基因 
都 能 产生 同一 种 显 性 特征 时 ， 即 便 我 们 让 其 中 
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ERRAZEN, ROS BUUNTU OR aH A 





“但 有 些 系 统 ( 比 


个 基因 不 起 作用 ， 这 个 显 

















性 。 很 多 需要 保持 平衡 的 系统 都 有 这 种 类 型 的 备用 原因 。 


之 间 似 乎 并 不 存在 依赖 
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1, 大 部 分 计算 法 都 要 求 我 








计 临 界 值 , 用 于 界定 变量 之 间 的 关联 是 否 可 以 被 接受 ( 使 用 





HE). 所 以 ， 某 个 结 








不 需要 有 真正 的 抵消 效应 或 无 依赖 性 的 因果 关系 就 能 违 
反 忠 实 性 假设 。 因 为 在 实际 研究 





门 设 定 一 个 统 
P 值 或 其 他 标 








出 现 的 概率 无 须 与 其 在 某 种 原因 下 出 : 


岗 的 概率 完全 


相等 ,只 要 两 个 数值 的 差别 足够 小 , 能 够 保证 结果 仍 处 于 可 接受 的 范围 之 


内 就 可 以 了 。 比 如 说 , 跑步 之 后 体重 下 降 的 概率 可 能 与 不 跑步 也 体重 下 降 
的 概率 并 不 相同 , 但 如 果 二 者 的 差别 极 小 , 可 能 就 会 导致 跑步 与 体重 下 降 








之 间 的 关系 违反 忠 
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实 性 假设 








选择 偏差 也 会 导致 分 布 的 数据 无 法 反映 各 种 真实 关系 。 比 如 这 里 有 
一 份 来 自 医院 的 数据 ,其 中 包括 各 种 诊断 记录 和 检查 结果 。 然而, 有 一 项 
检查 十 分 昂贵 ， 所 以 只 有 在 病人 出 现 十 分 罕见 的 症状 并 且 无 法 通过 其 他 方 
式 确诊 时 ， 医 生 才 会 让 病人 去 做 这 项 检查 。 结 果 ， 绝 大 部 分 检查 结果 都 是 
阳性 的 ,但 我 们 无 法 从 这 些 观 察 数据 中 得 知 这 种 检查 结果 呈 阳 性 的 真正 概 
率 。 因 为 只 有 在 检查 结果 呈 阳 性 的 可 能 性 很 大 时 ， 医 生 才 会 让 病人 去 做 这 

















个 检查 。 我 们 观察 到 的 通常 是 医学 检测 




































































个 非常 有 限 的 范围 ,比如 说 有 





些 测试 可 能 只 针对 那些 病情 最 严重 的 病人 比如 在 重症 监护 室 的 有 创 血 
压 监 测 )。 观 察 到 的 数值 范围 也 只 包括 那些 病情 严重 到 需要 用 这 种 监测 的 




















病人 的 数据 。 这 意味 着 如 果 我 们 在 这 个 有 限 的 群体 中 发 现 了 一 种 因果 关系 ， 


也 不 代表 这 种 因果 
同样 ， 由 于 这 种 样 























关系 在 整个 人 群 中 也 能 成 立 ， 这 就 是 我 们 面临 的 问题 。 
本 缺乏 变化 ， 我 们 可 能 无 法 找到 事物 之 间 的 真正 关联 。 





这 与 数据 缺失 的 问题 有 关 。 变 量 的 缺失 可 能 会 导致 天 系 的 错乱 ， 而 


测量 数据 的 缺失 能 
样 导致 人 们 做 出 错 


= 























够 产生 一 种 无 法 反映 真正 潜在 关系 的 分 布 形式 , 从 而 同 
误 的 推理 ,数据 的 缺失 通常 都 不 是 随机 删除 数据 集中 的 








数据 导致 的 , 而 是 取决 于 其 他 变量 有 没有 被 测量 到 。 比 如 说 , 在 住院 病人 


的 医疗 程序 中 ， 可 


能 需要 断 开 一 些 监测 器 〈 导致 数据 记录 中 出 现 空白 )， 


或 者 某 个 设备 故障 可 能 会 导致 有 些 数据 没有 被 记录 下 来 。 当 血糖 超出 正 
常 范围 时 ,人 们 可 能 会 更 加 频繁 地 测量 血糖 值 , 所 以 测量 数据 中 的 大 幅 空 





























白 和 实际 测量 值 之 间 并 非 是 毫 无 联系 的 , 而 测量 出 来 的 数据 也 可 能 会 偏向 




















极端 区 间 。 由 于 某 个 隐藏 的 原因 所 导致 的 数据 缺失 可 能 会 引发 混乱 ， 而 设 


备 故 障 则 可 能 意味 
HAE )。 






































着 其 他 相 邻 的 测量 结果 也 有 问题 ( 并 可 能 导致 结果 出 现 
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果 关 系 简 易 入 门 











实际 上 ， 我们 只 能 假设 在 样本 足够 大 的 时 候 ， 样 本 的 分 布 会 反映 数 
据 背后 的 真实 结构 。 如 果 我 给 一 个 朋友 打 电 话 , 然后 我 的 门铃 立刻 响 了 起 
来 , 我 无 法 断言 这 种 现象 是 否 还 会 再 发 生 。 但 如 果 我 注意 到 这 种 现象 出 现 
了 5 次 或 者 15 次 呢 ? 假设 ， 通 常 随 着 数据 集 大 小 的 增长 ， 我 们 会 越 来 越 
接近 事件 的 真实 分 布 情况 。 如 果 你 只 抛 了 几 次 一 枚 公正 的 硬币, 那 你 可 能 
不 会 看 到 正面 朝 上 的 次 数 与 反面 朝 上 的 次 数 相 一 致 ， 但 当 你 抛 硬币 的 次 
数 接近 无 穷 次 时 ,正面 朝 上 和 反面 朝 上 的 次 数 比 会 接近 1 : 1(50/50 )。 这 
里 所 说 的 更 多 的 数据 指 的 是 见 到 一 连 串 罕见 事件 的 机 会 减少 了 。 这 一 连 串 
的 罕见 事件 并 不 能 反映 事件 背后 真正 的 概率 , EE BEE = PSN IK 
种 事件 。 

我 们 在 进行 因果 推理 时 也 会 做 出 同样 的 假设 : 假设 我 们 有 足够 多 的 
数据 , 假设 我 们 看 到 的 是 由 某 个 原因 引起 的 某 个 结果 出 现 的 真正 概率 , 而 
不 是 一 个 异常 现象 。 需要 注意 的 是 , 对 于 有 些 系 统 ( 比如 那些 非 稳定 性 系 
统 ) 而 言 ， 即便 是 一 个 无 穷 大 的 数据 集 也 无 法 满足 这 个 假设 的 要 求 ， 所 以 
一 般 情 况 下 , 我 们 必须 假设 这 些 关 系 是 不 会 随 着 时 间 的 变化 而 改变 的 。 前 
面 说 过 , 非 稳定 性 指 的 是 那些 像 股票 平均 日 收益 一 样 随 着 时 间 而 改变 的 特 
性 。 在 图 6-3 中 ,打折 销售 〈 虚线 时 间 序 列 ) 和 热 巧克力 销量 ( 实 线 时 间 
序列 ) 在 整个 虚构 的 时 间 序 列 中 几乎 没有 任何 相关 性 , 但 是 它们 在 阴影 期 
(代表 冬季 ) 却 是 高 度 相 关 的 。 所 以 ， 如 果 我 们 使 用 了 所 有 的 数据 ， 就 不 
会 发 现 打 折 销 售 导致 了 热 巧克力 的 销量 上 升 。 而 如 果 我 们 只 使 用 冬季 的 数 
据 ， 则 可 能 会 发 现 这 两 者 具有 很 高 的 相关 性 。 值 得 注意 的 是 ,更 多 的 数据 
并 不 能 解决 这 个 问题 , 我 们 需要 使 用 其 他 方法 来 处 理 这 个 问题 , 具体 内 容 


请 参见 第 4 章 。” 



















































































































































































一 一 热 巧克力 
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销量 --- 折扣 





图 6-3 ”两 个 变量 之 间 的 关系 随 着 时 间 的 变化 而 发 生 改 变 , 而 且 它 们 


只 有 在 阴影 期 才 具 有 相关 性 








6.1.3 正确 的 变量 


大 部 分 推理 方法 都 是 为 了 找到 变量 之 间 的 各 种 关系 。 如 果 你 手 上 掌 
握 的 是 金融 市 场 的 数据 , 那 你 研究 的 变量 可 能 会 是 各 个 股票 ; 如 果 在 政治 






































学 领域 , 那 你 研究 的 变量 可 能 是 竞选 捐款 额 和 通话 量 。 一 般 情 况 下 ,我们 
要 么 从 一 组 已 测量 的 事物 出 发 , 要 么 出 去 做 一 些 实地 测量 活动 ,而且 通 常 








会 将 我 们 测量 的 每 一 个 事物 都 看 作 一 个 变量 。 


























我 们 不 仅 需要 测量 正确 的 事物 ， 还 需要 确保 描述 这 些 事物 的 方式 是 
正确 的 一 一 这 一 点 一 定 要 明确 。 在 组 织 信息 的 过 程 中 , 除了 要 处 理 是 否 保 





留 某 些 信息 这 种 简单 的 问题 ， 
和 肥胖 症 可 能 属于 一 个 类 别 ( 














还 需要 做 出 很 多 选择 。 在 某 些 研究 中 , 肥胖 
所 以 我 们 只 要 记录 每 个 个 体 是 否 肥胖 或 患 有 











肥胖 证 就 可 以 了 )， 但 是 对 于 那些 致力 于 治疗 肥胖 症 患 者 的 研究 来 说 ， 对 





肥胖 和 肥胖 症 的 区 分 可 能 就 至 关 重 要 了 。 * 



































量 体 重 我 们 获得 了 一 组 数值 ， 


甚至 只 通过 询问 这 样 的 分 类 ， 我 们 就 已 经 做 出 男 一 个 选择 了 。 通 过 测 


这 些 数 值 被 映射 到 了 不 同 的 类 别 中 。 重要 的 
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果 关 系 简 易 入 门 














可 能 不 是 体重 , 而 是 体重 的 变化 或 变化 的 速度 。 我 们 可 以 计算 每 日 的 体重 
变化 量 或 每 周 的 体重 变化 趋势 , 无 须 使 用 最 初 的 体重 数据 。 由 于 结果 总 是 
相对 变量 组 而 言 的 , 所 以 无 论 我 们 做 出 的 决定 是 什么 , 它 都 会 改变 我 们 发 
现 的 结论 。 剔除 一 些 变量 可 能 会 让 其 他 原因 看 似 更 显著 ( 比如 剔除 一 个 备 
用 原因 可 能 会 让 留 下 的 那个 原因 的 影响 看 似 更 强大 )， 而 增加 一 些 原 因 则 
会 降低 另外 一 些 原 因 的 显著 性 〈 比如 增加 一 个 共同 的 原因 能 够 吻 除 我 们 
在 各 种 结果 之 间 误 加 上 的 关系 )。 
回想 一 下 本 章 开头 的 那个 例子 。 单 独 服用 两 种 药物 不 会 导致 血糖 升 
高 , 但 同时 服用 这 两 种 药物 就 对 病人 的 血糖 值 产生 了 显著 的 影响 。 在 各 个 
变量 和 各 种 生理 测量 值 ( 比如 血糖 值 ) 之 间 进 行 因 果 推 理 可 能 无 法 找到 任 
何 关系 , 但 如 果 同 时 考察 这 两 个 变量 和 生理 测量 值 , 我 们 就 可 以 找到 这 种 
不 良 反应 。 在 这 个 案例 中 , 正确 的 变量 就 是 同时 服用 这 两 种 药物 。 要 想 找 
到 正确 的 变量 不 是 一 件 容 易 的 事 , 这 也 是 我 们 可 能 无 法 从 一 些 数据 集中 做 
出 重要 推理 的 原因 之 一 。 
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6.2 图 解 模型 





为 了 向 别人 描述 某 个 因果 关系 ， 或 者 为 了 理解 各 个 事物 是 如 何 组 成 
一 个 整体 的 , 我 们 常常 会 画 一 张 图 。 这 些 图 形 实际 上 可 以 和 哲学 家 们 的 
果 概 率 理论 联系 在 一 起 。 下面 这 个 图 形 展示 的 是 一 个 变量 出 现 的 概率 是 如 


何 受 男 一 个 变量 影响 的 。 









































这 个 图 形 首先 告诉 我 们 广告 和 购买 行为 之 间 存 在 某 种 关系 。 然 后 又 
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告诉 我 们 这 个 关系 是 单 向 的 , 即 广告 影响 购买 行为 ,而 不 是 购买 行为 影响 
广告 。 现 在 ， 我 们 再 加 上 另 一 个 变量 。 























如 果 我 们 想 要 预测 是 否 会 发 生 购 买 行为 ， 需 要 知道 些 什么 呢 ? 这 些 
变量 之 间 的 连接 方式 告诉 我 们 , 我 们 唯一 需要 知道 的 就 是 , 是 否 有 人 看 到 
这 个 广告 。 从 视觉 上 来 说 , 天 气 位 于 图 形 的 右 侧 ， 和 前 两 个 变量 没有 任何 
联系 , 而 且 它 和 购买 行为 之 间 也 没有 箭头 , 这 就 意味 着 我 们 不 能 使 用 天 气 
来 影响 或 预测 购买 行为 。 

只 要 知道 一 个 变量 的 直接 原因 就 能 够 预测 这 个 变量 ， 这 个 前 提 条 件 
被 称 为 因果 关系 中 的 马尔 可 夫 条 件 。" 更 严格 地 说 ， 在 变量 的 原因 已 经 给 
定 的 情况 下 , 变量 是 独立 于 它 的 非 衍 生物 的 (衍生 物 指 的 是 由 变量 导致 的 
结果 ， 以 及 由 这 些 结果 导致 的 结果 ， 等 等 )。” 这 里 的 箭头 是 从 原因 指向 
结果 的 ， 所 以 直接 原因 就 是 那些 通过 一 个 箭头 与 某 个 结果 联系 在 一 起 的 

为 了 说 明 直 接 原因 的 重要 性 ,我 们 将 做 广告 的 原因 也 增加 进来 。 
















































































策略 





如 果 营 销 策略 只 能 通过 广告 来 影响 购买 行为 , 那么 购买 行为 发 生 的 概率 
则 只 取决 于 广告 一 一 导致 购买 行为 的 直接 原因 。 一旦 广告 这 个 值 确定 了 , 那 
么 它 的 产生 方式 就 不 重要 了 。 即 使 我 们 发 现 了 很 多 导致 这 个 广告 产生 的 原 
因 , 也 不 会 改变 我 们 预测 购买 行为 所 需 的 信息 。 这 是 因为 所 有 的 原因 对 购买 
行为 的 影响 都 要 通过 广告 来 实现 。 以 下 面 这 个 图 为 例 。 
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根据 这 幅 图 ， 如 果 我 们 想 要 知道 关于 购买 行为 的 信息 ， 就 无 须知 道 
些 广告 是 否 来 自 同 一 个 策略 ,或 者 是 否 属于 某 一 个 预算 庞大 的 广告 攻 








we 
势 。 要 想 知道 购买 行为 是 否 会 发 生 , 我 们 只 要 知道 广告 有 没有 播 出 就 可 以 























了 。 这 和 第 5 章 介 绍 的 筛选 法 的 思路 是 一 样 的 。 从 理论 上 说 ， 如 果 我 们 能 








够 直接 干预 广告 活动 , 那么 无 须 对 营销 策略 或 预算 做 任何 调整 也 能 让 购买 
行为 发 生变 化 ， 因 为 购买 行为 完全 是 由 我 们 设 定 的 广告 值 决定 的 。 然 而 ， 
我 们 几乎 不 可 能 真 的 只 单独 干预 某 一 个 变量 而 不 改变 图 中 的 其 他 变量 


























(第 7 章 将 详细 介绍 这 一 内 容 ) 我 们 不 可 外 
走 ， 而 且 这 些 干 预 措施 还 会 导致 各 种 预想 不 到 的 副作用 。 








像 变 戏法 一 样 把 广告 变 来 又 变 














然而 ， 这 种 类 型 的 图 形 并 不 能 反映 每 一 种 可 能 发 生 的 情况 。 更 多 的 

















购买 行为 也 可 能 会 导致 广告 投放 量 的 增加 或 者 导致 营销 策略 发 生变 化 , 从 
而 在 图 中 形成 一 个 循环 。 我 们 将 要 介绍 一 种 叫 作 贝 叶 斯 网 络 的 图 解 模 型 ，” 
它 是 一 种 有 方向 的 非 循环 图 形 。 非 循环 指 的 是 图 形 中 没有 循环 , 所 以 下 面 
































这 个 图 形 不 包括 在 这 种 模型 范围 之 内 。 

















假设 你 沿 着 非 循环 图 上 的 一 条 路 径 鱼 





























前 走 ， 那 你 永远 都 不 可 能 回 到 


你 出 发 的 那个 点 。 在 用 这 些 图 形 结构 简化 概率 计算 活动 时 , 非 循环 图 的 这 


第 6 章 计算 法 | 143 





一 特征 至 关 重 要 。 举 个 简单 的 例子 : 在 每 个 变量 非 真 即 假 的 情况 下 ,我们 
想 知 道 购买 行为 和 广告 同时 出 现 的 概率 。 如果 没有 循环 ， 当 广告 和 购买 行 
为 中 间 只 有 一 个 箭头 时 , 这 两 个 事件 同时 发 生 的 概率 就 是 在 出 现 广告 的 情 
况 下 发 生 购 买 行为 的 概率 乘 以 出 现 广告 的 概率 。 ”因为 购买 行为 是 由 广告 
决定 的 ， 所 以 我 们 只 需 知道 购买 行为 在 出 现 广 告 时 发 生 的 概率 就 可 以 了 。 
然后 ， 我 们 还 要 考虑 广告 真正 发 生 的 概率 。 比 如 说 ， 人 们 在 观看 某 个 广告 
之 后 发 生 购买 行为 的 概率 为 1， 但 是 出 现 广 告 的 概率 要 低 一 些 ， 比 如 0.01， 
那么 两 者 一 起 发 生 的 概率 就 是 0.01。 

但 如 果 广 告 和 购买 行为 之 间 存 在 一 个 反馈 循环 , 那么 广告 出 现 的 概 
率 也 会 依赖 于 购买 行为 发 生 的 概率 。 如 果 我 们 想 要 这 个 影响 同时 发 生 ， 
就 会 加 大 概率 计算 活动 的 难度 ， 但 通过 增加 时 间 变 量 可 以 解决 这 个 问 
题 。 我 们 可 以 假设 在 某 个 时 间 段 发 生 的 购买 行为 对 广告 产生 的 影响 并 不 
会 立即 出 现 ， 而 是 存在 一 定 的 延迟 。 为 了 表示 这 一 现象 ， 我 们 需要 多 个 
图 形 。 
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t (广告 出 现 当日 ) ”t+1 (广告 出 现 次 日 ) 

















图 左 表示 的 是 各 个 变量 在 1 时 刻 的 联系 , 图 右 表示 的 是 各 个 变量 在 下 
一 个 时 刻 CBD t+1 ) 的 联系 。 在 这 两 个 图 形 中 ， 广 告 和 购买 行为 都 没有 
连接 在 一 起 ,因为 它们 不 会 立即 对 对 方 产生 影响 。 就 每 个 时 间 点 而 言 , 这 
两 个 图 形 中 都 是 一 个 贝 叶 斯 网 络 , 所 以 它们 是 不 可 能 有 循环 的 。 但 只 要 我 
们 不 把 这 两 个 变量 都 放 在 同一 图 形 中 , 广告 和 购买 行为 之 间 就 可 能 会 出 现 
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即时 效应 ， 反 之 亦 然 。 接 下 来 ,我 们 跨越 时 间 将 这 些 图 形 连 接 起 来 ， 以 表 
示 变 量 之 间 的 反馈 作用 。 








oer 1 ‘ TUKA) 
然后 ， 这 个 图 形 结构 就 会 随 着 时 间 的 延续 而 不 断 重复 ， 每 一 个 时 间 
点 的 购买 行为 都 取决 于 前 一 个 时 间 点 的 广告 值 ， 反 之 亦 然 。 




















t T m (FRB, 
以 此 类 推 ) 


这 种 图 形 叫 作 动态 贝 叶 斯 网 络 ， 但 图 形 结构 本 身 并 不 会 随 着 时 间 的 
变化 而 真正 发 生 改 变 。 ”有 的 结构 更 加 复杂 ， 会 出 现 多 重 时 间 间 隔 ， 并 且 
变量 之 间 的 联系 也 不 一 定 会 立即 在 下 一 个 时 间 点 出 现 。 有 的 结构 可 能 会 出 
现 更 长 的 时 间 间 隔 ， 比 如 接触 某 种 病毒 和 出 现 感染 症状 之 间 的 时 间 间 隔 。 
注意 , 随 着 变量 及 时 间 间 隔 数量 的 增加 , 我 们 推理 这 些 结构 的 复杂 程度 也 
会 大 大 提高 。 


6.2.1 图 解 模型 在 什么 情况 下 会 表示 因果 关系 
尽管 我 们 可 以 用 图 形 来 表示 因果 关系 ， 但 这 并 不 意味 着 我 们 绘制 的 





































































































或 者 知道 的 每 一 








是 , 我 们 也 可 以 用 
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个 图 解 模型 表示 的 都 是 因果 关系 。 到 目前 为 止 , 我 们 只 用 


























内 容 来 过 滤 垃 圾 信息 ,以 及 如 何 通 过 图 像 来 识别 人 脸 。 此 外 ， 可 能 


形 都 与 一 组 概率 关系 一 致 〈《 即 多 个 图 形 都 能 











图 形 表 示 了 一 个 事物 出 现 的 概率 是 如 何 受 男 一 个 事物 出 现 概率 影响 的 ,但 
图 形 来 表示 如 何 通 过 声音 特征 实现 语音 识别 , 如 何 根 据 


多 个 图 


有 来 表示 同一 组 依赖 性 关系 )。 


我 们 怎样 才能 知道 某 个 图 示 模 型 表示 的 是 因果 关系 呢 ? 这 个 问题 的 
答案 主要 藏 在 那些 将 图 形 和 ( 目前 所 讨论 的 ) 各 种 理论 连 在 一 起 的 假定 之 
中 。 将 图 示 模 型 用 于 因果 推理 的 主要 研究 者 不 仅 有 哲学 家 , 还 及 


























RRA LAME 














示 模 型 结合 在 一 起 的 计算 科学 家 。 

假设 广告 不 仅 能 够 引起 购买 行为 ， 还 能 提高 品牌 认 知 度 ( 如 图 6-4a 
所 示 )。 如 果 我 们 没有 用 来 表示 广告 的 变量 ， 还 要 试图 从 一 组 数据 中 推理 
出 变量 之 间 的 关系 ， 那 我 们 可 能 会 发 现 如 图 6-4b 所 示 的 图 形 ， 让 我 们 错 
误 地 认为 购买 行为 提高 了 品牌 认 知 度 。 回想 一 下 本 章 前 面 介绍 的 无 隐藏 的 
共同 原因 的 假设 或 者 原因 充分 性 假设 , 我 们 在 这 里 需要 借用 这 些 假 设 来 避 
免 出 错 。 一 般 来 说 , 任意 数量 的 变量 中 都 可 能 有 一 个 共同 的 原因 ， 如 果 这 
个 原因 没有 被 测量 到 的 话 ， 我 们 就 无 法 保证 由 此 推理 出 的 关系 是 正确 的 。 








如 果 广 告 变量 表示 的 是 





原因 却 是 消费 者 














需要 找到 正确 的 
一 次 烟 不 太 可 能 






























































p 些 将 因 


















































“是 否 在 电视 台 购 买 了 广告 空间 ”, 但 真正 的 
看 到 广告 的 次 数 , 情况 又 会 怎么 样 呢 ? 与 之 前 一 样 , 我 们 
变量 。 因果 关系 可 能 会 包括 各 种 复杂 的 条 件 组 合 : 也 许 抽 











导致 肺癌 , 但 是 连 抽 很 多 年 就 很 有 可 能 导致 肺癌 ; 药物 通 
常 都 有 不 同等 级 的 毒性 , 所 以 服用 5 毫克 药物 可 能 不 会 产生 不 良 反应 , 但 


























是 服用 同样 的 药物 50 毫克 却 可 以 致命 ; 西 柚 本 身 是 无 毒 的 ， 但 它 可 以 与 


很 多 药物 相互 作 





不 是 烟 龄 )、 是 否 服 月 














用 ， 从 而 产 4 





E 严 重 的 不 良 反 应 。 如 果 变 量 仅 仅 是 地 











上 某 种 药物 ( 而 不 是 服用 该 药物 的 站 
( 而 不 是 在 服用 某 种 药物 时 食用 西 柚 )， 我 们 可 能 无 法 找到 这 些 因 细 





由 烟 ( 而 


jÆ) 和 食用 西 机 























也 可 能 会 发 现 一 些 错误 的 关系 。 
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图 6-4 左 图 反映 了 奸 





这 些 结构 表示 的 是 概率 关系 ， 我 1 
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果 关 系 简 易 入 门 





(a) (b) 











o 


和 件 之 间 真实 的 结构 。 如 果 没 有 观察 到 广告 这 个 
变量 ,我 们 可 能 就 会 发 现 右 图 这 个 错误 的 结构 


门 从 中 能 够 得 知 需要 获得 哪些 变量 


才能 预测 出 其 他 变量 出 现 的 概率 。 但 若 要 想 真 正 算出 这 个 概率 , 我 们 还 需 


要 男 一 条 信息 。 
一 个 贝 叶 斯 网 络 包括 两 部 分 : 4 
条 件 性 概率 分 布 组 合 。 简单 来 说 , 这 些 组 合 不 过 是 一 些 





























吉 构 ( 各 个 变量 之 间 的 连接 方式 ) 和 





表格 。 这 些 表 格 让 


我 们 能 够 在 给 定 原因 变量 值 ( 真 或 假 ) 的 情况 下 得 知 一 个 变量 的 两 个 值 
(HIR) 出 现 的 概率 。 针 对 广告 和 购买 行为 的 那个 图 形 ， 我 们 有 一 个 两 
行 两 列 的 表格 。 
购买 行为 为 真 ” 购买 行为 为 假 
广告 值 为 真 0.8 0.2 
广告 值 为 假 0.3 
oe VEE lyse 


一 个 值 ， 而 这 些 值 出 现 的 概率 之 和 必须 为 1。 每 一 列 的 概率 和 不 为 1， 因为 








它 反映 的 是 购买 行为 的 某 一 个 值 在 广告 值 为 真 和 广告 














值 为 假 这 两 种 前 提 


下 出 现 的 概率 。 这 个 简单 的 图 表 还 不 完整 , 还 需要 另 一 个 反映 广告 概率 的 


表格 。 我 们 已 经 知道 了 在 广告 值 给 定 的 情况 下 如 何 





























率 , 但 是 怎样 

















角 定 购买 行为 发 生 的 概 
才能 找到 广告 出 现 的 概率 呢 ? 表示 广告 概率 的 表格 中 只 有 两 
个 数字 ,因为 广告 在 这 个 图 形 中 是 没有 父 级 元 素 的 , 而 








且 它 出 现 的 概率 也 
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不 取决 于 任何 事物 ( 就 像 抛 硬 币 时 出 现 正 面 朝 上 或 反面 朝 上 的 概率 通常 也 
不 取决 于 任何 变量 的 值 )。 

















对 于 贝 叶 斯 网 络 中 的 每 一 个 节点 来 说 ,我 们 都 会 有 一 个 类 似 的 表格 。 
知道 这 个 网 络 结构 可 以 极 大 地 简化 我 们 的 计算 工作 , 因为 每 一 个 变量 的 值 
都 是 由 其 父 级 元 素 决定 的 。 相 反 ， 倘 若 我 们 对 变量 之 间 的 联系 一 无 所 知 ， 
就 不 得 不 将 每 一 个 变量 都 包含 到 表格 的 每 一 行 之 中 。 如 果 存 在 N 个 可 以 为 
真 或 为 假 的 变量 ， 那 么 我 们 就 会 有 2" 行 。 我 们 既 可 以 从 数据 中 了 解 变量 
之 间 的 结构 和 各 个 变量 出 现 的 概率 , 也 可 以 根据 我 们 了 解 的 信息 构建 一 个 
结构 ， 以 此 来 了 解 各 个 变量 发 生 的 概率 。 

无 论 在 哪 一 种 情况 下 ， 我 们 都 要 保证 这 些 数据 能 够 准确 反映 变量 之 
间 真 正 的 依赖 关系 。 这 就 又 回 到 了 典型 分 布 假设 或 忠实 性 原则 的 问题 上 
了 。 比 如 说 ， 某 些 广告 不 可 能 既 通 过 某 种 方式 增加 购买 行为 ,又 通过 决策 
疲劳 等 因素 减少 购买 行为 。 如 果 出 现 这 种 情况 , 我 们 可 能 会 发 现 广告 和 购 
买 行为 之 间 没有 任何 依赖 关系 , 虽然 它们 在 真正 的 结构 中 之 间 是 存在 依赖 
关系 的 。 另 外 ,如 果 数 据点 太 少 的 话 , 我 们 可 能 也 无 法 准确 地 找到 各 个 变 
量 出 现 的 正确 概率 。 

有 些 情况 下 , 忠实 性 原则 可 能 也 无 法 实现 , 比如 第 5 章 讨论 过 的 辛 普 
森 悖 论 。 其 中 一 个 案例 告诉 我 们 ,由 于 我 们 对 数据 的 划分 方式 不 同 (比如 
是 研究 所 有 病人 ， 还 是 只 研究 男性 病人 或 女性 病人 )， 如 果 存 在 分 组 偏差 
( 比如 服用 A 药品 的 女性 比 服用 B 药品 的 女性 多 ) 并 且 结 果 也 不 一 样 的 话 
( 比如 不 管 有 没有 服药 , 女性 病人 的 表现 都 比 男性 病人 好 ), 我 们 可 能 会 看 
到 并 不 存在 的 独立 性 。 

另 一 种 复杂 的 情况 是 出 现 决定 性 关系 。 比 如 说 ， 每 收 到 一 封 电子 邮 
件 ， 我 的 电脑 都 会 发 出 声响 ， 而 电脑 的 声响 又 会 让 我 的 狗 汪汪 乱 叫 。 


电子 邮件 声响 
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如 果 在 出 现 声响 的 情况 下 ， 狗 叫 的 概率 为 1， 而 在 出 现 电 子 邮 件 的 情 
WF, 电脑 发 出 声响 的 概率 也 为 1 ( 所 以 当 这 两 个 事件 的 原因 出 现时 , 这 
两 个 事件 也 一 定 会 出 现 )， 那 么 声响 是 不 会 让 电子 邮件 和 狗 叫 成 为 独立 性 
事件 的 , 尽管 这 个 结构 告诉 我 们 它们 应 该 是 相互 独立 的 。 假设 你 只 知道 是 
否 收 到 了 电子 邮件 。 如 果 收 到 了 电子 邮件 , 电脑 就 会 发 出 声响 ,而 电脑 发 
出 声响 后 狗 就 会 乱 叫 ， 所 以 你 就 能 由 此 知道 其 他 变量 的 状态 。 因 此 , 你 可 
能 会 错误 地 发 现 电子 邮件 直接 导致 了 另外 两 个 变量 的 出 现 。 这 个 问题 不 仅 
是 图 示 模 型 中 存在 的 问题 ， 也 是 大 部 分 概率 法 中 的 一 个 难题 。 

总 的 来 说 ， 在 下 列 假设 中 ， 图 解 模型 表示 的 是 因果 关系 。 

口 一 个 变量 的 概率 只 取决 于 引起 这 个 变量 的 原因 ( 因果 关系 中 的 马 

尔 可 夫 条 件 )。 

口 所 有 共同 的 原因 都 要 测量 到 ( 充分 性 原则 )。 

口 我 们 使 用 的 数据 准确 地 反映 了 变量 之 间 真 正 的 依赖 关系 〈 忠实 性 
原则 )。 

还 有 一 些 隐 仿 的 假设 〈 比如 充分 的 数据 、 变 量 的 描述 必须 正确 等 ) 
也 能 保证 因果 推理 的 正确 性 , 但 是 上 述 三 个 假设 是 最 广为人知 的 , 也 是 表 
示 因 果 关 系 和 不 表示 因果 关系 的 图 形 之 间 最 主要 的 差别 。 


6.2.2 ”从 数据 到 图 形 


假设 我 们 有 一 些 关 于 某 个 公司 雇员 情况 的 数据 。 我 们 知道 他 们 的 工 
作 时 间 、 休 假 信息 、 部 分 生产 指标 等 信息 ,怎样 才能 找到 这 些 因素 之 间 的 
因果 关系 网 络 呢 ? “ 

我 们 可 以 找 一 个 指标 来 衡量 一 个 模型 对 数据 的 描述 能 力 ， 然 后 搜索 
可 能 的 模型 ,找到 在 这 个 指标 下 得 分 最 高 的 模型 。 这 种 方法 叫 作 搜索 评分 
法 。“ 如果 休 假 导致 生产 力 提高 是 这 个 数据 中 的 唯一 关系 ,那么 带 有 这 样 
一 个 (从 休假 指向 生产 力 的 ) 箭头 的 模型 应 该 比 包 含 其 他 关系 的 模型 或 者 
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箭头 方向 相反 (从 生产 力 指向 休假 的 箭头 ) 的 模型 得 分 高 ， 即 图 6-5a 的 得 
分 应 该 比 其 他 图 形 的 得 分 高 。 因 为 只 有 三 个 变量 ， 所 以 我 们 可 以 列 出 所 有 
可 能 的 图 形 ， 逐 个 测试 ， 然 后 再 做 出 选择 。 
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(a) (b) (0) 
图 6-5 如 果实 际 情况 是 V (休假 ) 导致 P( 生产力 )， 那 么 第 一 个 
图 形 的 得 分 应 该 是 最 高 的 
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要 想 从 中 做 出 选择 ,我 们 还 需要 用 一 个 方法 来 计算 哪个 图 形 与 数据 
更 相符 。 用 来 评分 的 函数 有 很 多 , “但 从 根本 上 来 说 ， 除 了 要 避免 将 图 形 
和 特定 数据 集中 的 噪声 与 特征 进行 匹配 , 我们 对 数据 的 描述 程度 也 存在 一 
个 平衡 点 ,我 们 可 以 通过 一 个 非常 复杂 的 结构 来 完美 解释 数据 集中 的 每 一 
个 点 , 但 我 们 想 要 找到 一 个 模型 来 描述 各 个 变量 之 间 更 为 普遍 的 关系 ,而 
不 是 解释 数据 中 的 每 一 处 噪声 。 
因此 ， 当 图 形变 得 越 来 越 复杂 时 ， 有 些 因素 可 能 就 很 难 解释 了 。 然 
而 ,我 们 不 能 从 所 有 可 能 的 图 形 中 进行 选择 。 一 个 仅 有 10 个 变量 的 数据 
集 就 有 10™ 种 可 能 的 图 形 ，” 这 些 图 形 的 数量 是 美元 流通 量 的 100 万 倍 以 
Eo “更 不 要 说 S&P 500 指数 中 所 有 股票 之 间 的 各 种 关系 了 。 只 要 25 个 
变量 ,我 们 得 到 的 所 有 可 能 图 形 的 数量 ( 超过 10”) 就 会 让 宇宙 中 所 有 
原子 的 数量 (估计 只 有 10”) HULA.” 

没有 任何 方法 能 让 我 们 一 一 测试 这 些 图 形 ， 但 其 实 也 不 需要 一 一 测 
试 它们 。 我 们 可 以 随机 想 出 尽 可 能 多 的 图 形 , 然后 再 选 出 其 中 最 好 的 一 个 。 
1 于 可 能 出 现 的 图 形 数量 太 多 , 所 以 我 们 碰巧 选中 最 好 的 那个 的 可 能 性 不 
大 。 因 此 , 我 们 需要 为 那些 计算 程序 提供 一 些 线索 ,告诉 它们 哪些 图 形 更 
值得 研究 。 
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假设 我 们 一 一 测试 了 图 6-6 中 的 前 三 个 图 形 ， 然 后 发 现 图 6-6c 的 得 
分 最 高 。 接 下 来 最 好 的 策略 是 去 研究 与 这 个 图 形 相近 的 其 他 图 形 , 而 不 是 
随机 想 出 第 四 个 图 形 。 我 们 可 以 增加 一 个 箭头 、 改 变 箭头 的 方向 或 者 删除 
一 个 箭头 , 来 看 看 图 形 的 得 分 是 如 何 变化 的 。 也 有 可 能 最 好 的 图 形 其 实 是 
图 6-6d 所 示 的 图 形 ， 但 由 于 我 们 使 用 了 上 述 策略 ,一 直 在 优化 第 三 个 图 
形 , 并 且 在 找到 真正 的 结构 之 前 就 已 经 停止 了 测试 工作 , 所 以 我 们 永远 也 
没有 机 会 测试 到 第 四 个 图 形 。 如 果 我 们 不 能 测试 到 每 一 个 图 形 , 就 无 法 确 
保 最 好 的 图 形 已 经 被 测试 了 。 图 6-7 向 我 们 解释 了 这 种 局 部 最 优化 的 问题 。 
如 果 y 轴 代表 图 形 的 得 分 ,而 我 们 只 测试 标记 点 周围 的 图 形 ， 由 于 那个 区 
域 中 最 高 的 点 就 是 这 个 标记 点 , 那 我 们 可 能 就 会 认为 那个 点 就 是 所 有 图 形 
中 得 分 最 高 的 点 , 这 就 叫 作 陷入 局 部 最 优化 陷阱 。 虽然 我 们 在 某 个 区 域 得 
到 了 最 高 分 ， 但 这 却 不 是 所 有 可 能 的 分 数 中 最 高 的 分 数 。 
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(a) (b) ©) (a) 
图 6-6 图 中 A、B、C、D 为 变量 。 图 (a) (b) Cc) 展示 的 是 可 能 被 测 
试 到 的 各 种 可 能 的 图 形 ， 图 Cd) 展示 的 是 变量 之 间 真 正 的 结构 
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6-7 ”局 部 最 优化 示意 图 
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为 了 解决 这 个 问题 ,用 于 寻找 因果 结构 的 各 种 算法 使 用 了 更 加 巧妙 
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的 方法 , 以 此 来 限制 需要 测试 的 图 形 组 合 , 并 且 尽 可 能 多 地 去 探索 搜索 空 
间 的 各 个 领域 。 如 果 我 们 知道 性 别 只 能 是 原因 而 绝 不 会 是 结果 ， 那 就 可 
以 避免 测试 所 有 将 性 别 当 成 结果 的 图 形 。 如 果 我 们 对 要 寻找 的 结构 样式 有 
一 定 的 了 解 , 那么 就 能 为 整个 图 形 组 合 设计 出 一 个 概率 分 布 图 , 并 且 可 以 
用 它 来 引导 我 们 找到 那些 更 有 研究 价值 的 各 种 可 能 出 现 的 结构 。” 

除了 去 搜索 那个 数量 多 得 可 怕 的 潜在 图 形 集 以 外 ,我们 还 可 以 使 用 
变量 之 间 的 依赖 性 来 建构 那个 得 分 最 高 的 图 形 。 约束 法 就 是 这 样 做 的 。 它 
不 断 重复 测试 变量 之 间 的 独立 性 , 并 在 测试 结果 中 增加 、 减少 图 形 中 的 入 
k, 或 者 改变 图 形 中 箭头 的 方向 。 其 中 有 些 方法 是 每 次 增加 一 个 变量 ,还 
有 一 些 方 法 一 开始 就 已 经 将 所 有 的 变量 连接 在 了 一 起 ， 然 后 再 一 个 一 个 地 
删除 第 头 。” 

以 下 图 为 例 。 图 中 三 个 变量 之 间 所 有 可 能 出 现 的 联系 都 已 经 绘制 出 


来 了 。 
Fan 

如 果 我 们 发 现在 给 定 C 的 情况 下 ，A 和 B 是 相互 独立 的 ， 那 么 就 可 
以 删除 它们 之 间 的 连 线 , 然后 继续 寻找 变量 之 间 的 其 他 关系 , 看 看 还 能 删 
除 哪些 连 线 。 测试 的 顺序 也 很 重要 , 前 面 出 现 的 一 个 错误 可 能 会 导致 后 面 
出 现 更 多 的 错误 。 在 使 用 真实 数据 的 案例 中 , 我 们 看 到 变量 之 间 完 全 相互 
独立 的 可 能 性 不 大 ， 而 我 们 需要 判断 的 是 ， 应 该 在 什么 时 候 接受 或 拒绝 变 
量 之 间 相 互 独立 的 假设 。 如 果 在 给 定 B 的 情况 下 ，A 出 现 的 概率 和 A 本 
身 出 现 的 概率 完全 一 样 , 那么 这 两 个 变量 之 间 就 是 相互 独立 的 。 但 是 , 也 
有 可 能 在 给 定 B 和 C 的 情况 下 ，A 出 现 的 概率 和 在 只 给 定 C 的 情况 下 A 
出 现 的 概率 十 分 相近 , 但 不 完全 一 样 。 在 实际 研究 中 , 我 们 需要 选择 一 个 
统计 学 上 的 门槛 〈 临界 值 )， 来 决定 是 否 接受 基于 这 些 测 试 而 提出 的 条 件 
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独立 性 结论 。 此 外 ,由 于 我 们 需要 做 的 测试 数量 庞大 , 所 以 很 有 可 能 会 受 
到 多 重 假设 中 很 多 问题 的 影响 〈 参见 死 三 文 鱼 实验 )。” 

















6.3 衡量 因果 关系 








有 一 种 推理 方法 是 去 寻找 一 个 与 数据 一 致 的 或 者 能 够 对 数据 做 出 解 
竺 的 模型 。 但 是 ， 这 种 方法 在 计算 上 可 能 会 十 分 复杂 ， 而 且 我 们 有 时 只 
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知道 我 们 测量 的 所 有 变量 中 部 分 变量 之 间 的 关系 。 比 如 , 我 们 可 能 只 想 


1 








知道 生产 力 提高 的 原因 ， 那 就 不 需要 一 个 包含 所 有 被 测 变量 的 完整 模型 。 
随机 试验 解决 的 正 是 这 种 问题 ( 比如 某 种 药物 对 死亡 率 有 什么 影响 )， 但 
它 也 有 局 限 性 〈 详 见 第 7 章 )， 并 不 适用 于 所 有 的 情况 。 

还 有 一 种 推理 方法 主要 研究 的 是 量化 各 种 因果 关系 强度 的 问题 。 如 
休假 可 以 提高 生产 力 , 但 生产 力 不 能 导致 休假 , 那么 休假 作为 提高 生产 
力 的 原因 的 强度 应 该 很 高 ; 反之 , 生产 力 提高 作为 放假 的 原因 的 强度 应 该 
很 低 。 尽管 相 关 性 是 对 称 的, 但 在 衡量 因果 关系 的 显著 性 时 , 需要 利用 这 
些 关 系 中 的 非 对 称 性 特征 。 在 某 种 意义 上 , 因果 关系 的 显著 性 应 该 与 原因 
对 结果 的 解释 程度 相称 , 与 原因 作为 一 种 干预 手段 能 够 带 来 某 种 结果 的 有 
效 程度 也 相称 。 如 果 休 假 只 能 偶尔 提高 生产 力 , 而 加 班 总 是 能 够 提高 生产 
J, 那么 作为 生产 力 提 高 的 原因 ， 加 班 的 强度 要 高 于 休假 的 强度 。 同 样 ， 
如 果 强 迫 人 们 休假 是 提高 生产 力 的 有 效 策略 ， 而 强迫 人 们 加 班 不 是 提高 
生产 力 的 有 效 策略 ,那么 休假 就 会 再 次 成 为 提高 生产 力 的 一 个 更 为 显著 的 
原因 。 

如 果 休 假 能 够 提高 生产 力 只 是 因为 休假 可 以 让 员工 在 这 家 公司 待 得 久 
一 些 ， 且 有 经 验 员 工 的 生产 力 更 高 ， 那 么 我 们 想 要 知道 的 是 ， 经 验 对 于 提高 
生产 力 的 重要 性 是 否 高 于 休假 。 也 就 是 说 ， 我 们 想 要 发 现 最 直接 的 原因 ( 这 
些 原 因 在 图 形 中 是 父 级 原因 ， 而 不 是 更 遥远 的 祖父 级 原因 )。 
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如 果 可 以 用 一 种 方法 〈 完 全 独立 于 引起 其 他 任何 变量 的 原因 ) 去 评 
佑 生产 力 提高 的 原因 , 那么 我 们 可 以 做 更 少 的 测试 , 并 且 可 以 同时 进行 这 
些 测试 , 从 而 大 大 提高 计算 这 些 事 情 的 计算 程序 的 速度 。 这 种 方法 对 我 们 
有 着 很 大 的 吸引 力 一 一 这 意味 着 我 们 无 须 再 使 用 近似 法 ( 比如 只 研究 一 个 
子 集 而 不 是 所 有 的 图 形 )， 因 为 在 近似 法 中 ， 同 一 个 程序 运行 几 次 ， 每 次 
得 出 的 结果 可 能 都 不 一 样 ; 这 还 意味 着 这 些 计算 将 会 变 得 十 分 简单 ,我们 
可 以 用 精确 法 来 进行 计算 。 

这 种 方法 的 局 限 性 在 于 ， 如 果 没 有 一 个 结构 来 展示 所 有 变量 之 间 的 
联系 , 我 们 可 能 无 法 直接 使 用 这 些 结论 来 进行 预测 。 假设 我 们 发 现 党 派 的 
支持 会 让 参议 员 们 投票 支持 某 些 法 案 , 而 这 些 参 议员 所 属 选 区 选民 的 支持 
也 会 起 到 同样 的 效果 。 这 并 没有 告诉 我 们 这 两 种 支持 是 如 何 相互 作用 的 ， 
也 没有 告诉 我 们 如 果 这 两 种 支持 相 加 , 是 否 会 导致 参议 员 支 持 某 个 法 案 的 
决心 更 强 。 要 想 解决 这 个 问题 ,可 以 去 寻找 更 为 复杂 的 关系 。 我 们 并 不 是 
要 使 用 所 有 测量 过 的 变量 , 而 是 要 去 建立 各 种 联系 ( 政党 和 选民 对 提案 的 
支持 )、 了 人 解 某 个 变量 值 必须 为 真 的 时 长 (锻炼 一 天 、 一 个 月 、 一 年 等 ) 
并 考察 一 系列 事件 的 先后 顺序 ( 先 服用 药物 一 或 者 先 服用 药物 二 )。 我 们 
在 此 就 不 详细 论述 了 , 但 是 , 确实 有 些 方 法 可 以 用 来 表示 或 者 测试 这 类 复 
杂 的 关系 。” 


6.3.1 概率 与 因果 关系 的 显著 性 


在 给 定 原因 的 情况 下 ， 某 个 结果 出 现 的 条 件 性 概率 也 可 以 用 来 衡量 
原因 的 显著 性 。 所 以 , 我 们 可 以 观察 休假 能 在 多 大 程度 上 提高 生产 力 这 一 
结果 出 现 的 可 能 性 。 但 是 , 很 多 不 是 原因 的 事件 似乎 也 可 以 提升 其 他 事件 
发 生 的 可 能 性 。 如 果 工 作 时 长 和 休假 之 间 有 一 个 共同 的 原因 , 那么 它们 看 
起 来 就 像 是 彼此 提高 了 对 方 出 现 的 概率 。 

衡量 原因 强度 的 方法 有 很 多 , “但 这 些 方 法 的 基本 理念 都 是 要 以 某 种 
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方式 吸收 其 他 信息 来 解释 这 些 共同 的 原因 。 如 果 在 休假 和 加 班 这 两 个 变量 
都 为 真 时 ,生产力 提 高 的 概率 为 %， 而 只 有 加 班 这 一 个 变量 为 真 时 ,， AE 
产 力 提高 的 概率 也 为 和 9%, 那么 知道 休假 信息 并 不 能 提升 我 们 预测 生产 力 
提高 这 一 事件 出 现 概率 的 准确 性 。 然 而 在 实践 中 , 我 们 可 能 也 不 会 直接 测 
量 一 个 变量 。 也 许 我 们 并 不 能 准确 测量 人 们 的 工作 时 长 ,但 我 们 知道 他 们 
在 办 公 室 待 的 时 间 有 多 和 久 。 有 些 人 在 办 公 室 里 可 能 会 花 很 长 时 间 吃 午饭 ， 
会 花 很 长 时 间 写 私人 邮件 或 者 玩 电子 游戏 。 仅 赁 办 公 时 间 , 我 们 无 

法 将 这 些 人 和 那些 在 办 公 室 里 待 的 时 间 较 少 但 是 工作 效率 更 高 的 人 区 分 
开 。 因 此 ， 工 作 时 长 这 个 指标 无 法 完美 地 将 其 结果 进行 区 分 。 

这 一 点 类 似 于 我 们 前 面 看 过 的 一 些 例 子 。 在 那些 例子 中 ， 表 示 变 量 
的 方式 (是 将 几 个 因素 结合 在 一 起 还 是 一 个 一 个 单独 研究 ) 会 影响 推理 的 
结果 。 所 以 ， 我 们 不 仅 需要 一 组 变量 来 区 分 原因 和 结果 ， 还 应 该 认识 到 ， 
由 于 有 这 些 原因 以 及 其 他 原因 ( 数据 缺失 和 测量 失误 等 )， 没 有 因果 关系 
的 变量 之 间 可 能 也 会 存在 某 种 概率 上 的 依赖 性 , 我 们 必须 想 办 法 来 解决 这 
样 的 问题 。 

如 果 我 们 说 休假 可 以 提高 生产 力 ， 那 意思 是 休假 或 者 不 休假 会 对 生 
产 力 产 生 影响 。 如果 休假 是 一 个 十 分 重要 的 原因 , 而 且 不 需要 其 他 任何 因 
素 就 能 对 生产 力 产生 影响 ( 比如 需要 足够 的 可 支配 收入 以 便 休 假 不 会 造成 
经 济 压 力 ), 那么 不 管 其 他 变量 的 值 是 什么 ( 比如 工作 时 间 是 长 是 短 ), 休 
假 之 后 的 生产 力 都 应 该 得 到 提高 。 然 而 , 这 一 点 并 不 是 在 所 有 情况 下 都 成 
立 。 因 为 很 多 原因 不 仅 能 够 带 来 积极 的 影响 ,还 能 带 来 消极 的 影响 。 比 如 
说 , 安全 带 一 般 情况 下 可 以 避免 交通 事故 中 出 现 死 亡 事件 , 但 在 某 些 情况 
下 , 安全 带 却 可 能 因为 阻碍 人 们 从 落水 的 汽车 中 逃生 而 造成 死亡 事件 。 但 
我 们 仍然 可 以 假设 : 即使 安全 带 有 时 会 导致 死亡 事件 , 但 是 系 安全 带 死 于 
交通 事故 的 平均 概率 要 低 于 不 系 安全 带 的 平均 概率 。 

因此 ， 要 想 量化 某 个 原因 的 显著 性 ， 我 们 可 以 计算 这 个 原因 平均 在 
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多 大 程度 上 影响 了 其 结果 出 现 的 概率 。 简单 来 说 , 就 是 在 其 他 因素 保持 不 
变 的 情况 下 ， 这 个 原因 出 现 和 未 出 现时 某 个 结果 出 现 的 概率 会 有 多 大 的 变 
化 。 可 以 将 各 种 情况 出 现 的 概率 进行 加 权 计 算 。 如 果 在 一 个 非常 普遍 的 情况 
下 , 一 个 原因 可 以 显著 地 提高 某 个 结果 出 现 的 概率 , 那么 这 个 原因 的 显著 性 
比 那些 只 在 极 少数 情况 下 才能 提高 某 个 结果 出 现 概率 的 原因 要 大 得 多 。 

以 图 6-8 中 的 因果 结构 为 例 。 在 这 个 图 中 ， 政 党 支持 和 意识 形态 会 
影响 政客 们 的 投票 ,选民 的 意见 则 不 会 。 如 果 这 组 关系 真是 如 此 , 那么 不 
管 选 民 是 否 支 持 这 个 法 案 ， 它 获得 投票 的 概率 都 是 完全 一 样 的 。 但 是 ， 
如 果 意 识 形 态 或 政党 意见 发 生 了 变化 , 这 个 法 案 获 得 投票 的 概率 则 会 发 生 
改变 。 










































































政党 支持 。 意识 形态 选民 


投票 
图 6-8 选民 对 投票 的 重要 性 的 平均 值 会 低 至 0。 注意 ， 没 有 被 圈 出 
节点 的 图 形 不 是 贝 叶 斯 网 络 


























可 以 一 次 性 确定 所 有 变量 的 值 , ”然后 观察 各 种 变量 值 的 不 同 组 合 对 
结果 产生 的 影响 , 以 此 来 计算 因果 关系 的 显著 性 。 一 个 政党 可 以 支持 或 反 
对 一 项 法 案 , 意识 形态 可 以 符合 或 背离 一 项 法 案 , 选民 也 是 如 此 。 我 们 可 
以 研究 每 一 种 可 能 出 现 的 组 合 , 然后 观察 在 政党 支持 和 意识 形态 这 两 个 变 
量 的 每 一 种 组 合 中 , 选民 的 支持 会 对 结果 产生 什么 样 的 影响 。 由 于 这 两 个 
变量 完全 决定 了 政客 的 投票 ， 所 以 选民 的 支持 不 会 对 结果 产生 任何 影响 。 
然而 ， 随 着 变量 的 增加 , 我 们 无 法 留意 到 每 一 种 可 能 的 情况 ， 而 且 我 们 观 
察 到 的 案例 数量 也 不 足以 让 我 们 得 出 任何 具有 统计 意义 的 结论 。 为 此 , 我 
设计 了 一 个 更 实用 的 测量 显著 性 的 指标 : 在 一 个 变量 保持 不 变 的 情况 下 ， 
不 断 改变 原因 的 值 ( 真 或 假 )， 然 后 记录 原因 对 结果 的 不 同 影响 并 计算 它 
们 的 平均 值 。”“ 为 了 计算 这 个 因果 关系 显著 性 指标 的 值 (eng), RITI 
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出 在 政党 对 法 案 的 支持 保持 不 变 的 情况 下 , 选民 对 选举 结果 的 影响 有 和 多大， 





再 算出 在 意识 形态 保持 不 变 的 情况 下 ， 





























选民 对 选举 结果 的 影响 有 和 多大, 以 
此 类 推 ,最 后 把 这 些 不 同 的 数值 放 在 一 起 , 求 出 选民 显著 性 指标 的 平均 值 。 








在 大 部 分 情况 下 ， 以 上 面 这 种 概率 为 基础 的 计算 方法 都 是 从 一 个 数 


据 集 出 发 , 然后 得 出 一 个 数字 , 这 个 数字 会 告诉 我 们 一 个 变量 作为 原因 对 
男 一 变量 的 显著 性 如 何 。 这 个 显著 性 的 值 介 于 -1 和 1 之 间 ，-1 表示 的 是 
一 个 非常 强 的 、 导 致 结果 无 法 出 现 的 负面 原因 , 而 1 表示 的 是 一 个 非常 强 








的 、 一 定 会 导致 结果 出 现 的 正面 原因 。 


























1 于 在 实践 中 总 会 出 现 一 些 噪声 、 失 误 和 数据 缺失 的 情况 ， 所 以 我 


们 不 能 假定 不 是 原因 的 事物 的 显著 性 指标 的 值 就 一 定 为 零 。 相反, 我 们 经 





常 需 要 确定 哪些 因果 显著 性 指标 的 值 具有 统计 意义 ( 回忆 一 下 第 3 章 介绍 
的 P 值 和 多 重 假设 检验 )。” 比 如 说 ， 有 很 多 变量 可 能 是 某 些 变量 的 原因 ， 








但 是 它们 之 间 又 没有 真正 的 因果 关系 , 我 们 在 计算 这 些 变量 的 因果 
指标 的 平均 值 时 ， 会 发 现 这 些 显 著 性 值 eas 值 ) 的 分 布 看 起 来 就 
















































































显著 性 
像 一 个 
钟 形 曲 线 , RARE 6-9 中 的 浅 灰 色 柱 状 图 一 样 。 而 当 测 试 的 数据 集中 存 


在 一 些 真正 的 因果 关系 时 ， 这 些 显著 性 值 会 分 布 成 另 一 种 图 形 〈 图 6-9 中 





的 黑色 柱状 图 )。 我 们 观察 到 的 内 容 和 期 待 观察 到 的 内 容 之 间 存 有 








异 , 我 们 可 以 利用 这 种 差异 来 判断 显著 性 指标 的 哪些 值 应 该 被 看 成 是 








因果 关系 的 值 。” 


0 














p— ie 











原因 






























































因果 关系 。 由 于 有 噪声 和 其 








也 因素 ， 所 以 并 非 所 有 非 原 




















具有 





























因 





的 显著 性 值 都 是 零 ， 而 是 会 以 零 为 中 心 分 布 在 邻近 区 域 








OSH 


图 6-9 一 组 因果 关系 显著 性 值 的 柱状 图 。 浅 灰色 区 域 (以 0 为 中 心 , 即 
不 具 显 著 性 ) 代表 虚假 的 因果 关系 ， 而 黑色 柱状 图 代表 真实 的 


ies 


E 





要 想 保 证 因果 ! 
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X), WEH 
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著 性 高 的 变量 就 是 真正 的 原因 变量 ， 我 们 需要 确保 
测量 的 因果 关系 强度 是 准确 的 ( 以 便 这 些 概率 能 够 代表 变量 出 现 的 真实 概 
































保 也 测量 了 变量 之 间 的 共同 原因 ( 否则 我 们 可 能 会 高 估 其 他 


原因 的 显著 性 或 者 发 现 一 些 并 不 存在 的 关系 )。 对 于 时 间 序 列 来 说 , 通常 
还 需要 假设 这 些 关 系 不 会 随 着 时 间 的 变化 而 发 生 改 变 。 因为 如 果 这 些 关 系 
随 着 时 间 的 变化 而 发 生 改 变 , 那么 可 能 就 会 出 现 这 样 的 情况 : 两 个 变量 在 


时 间 序 列 的 一 个 时 间 段 











是 相互 独立 的 , 但 在 另 一 个 时 间 段 里 却 不 然 。 在 











这 种 情况 下 , 尽管 两 个 变量 之 间 的 关系 在 一 段 时 间 内 可 能 很 强 , 但 是 当 我 
们 考察 整个 时 间 段 时 ， 两 个 变量 之 间 的 关系 可 能 会 显得 很 弱 。 
我 们 已 经 探讨 了 “为 什么 ”的 问题 ， 但 还 没有 讨论 过 “什么 时 候 ” 


的 问题 。 在 有 些 计算 因果 显著 性 的 方法 
个 时 间 间 隔 或 时 窗 , 以 便 计 


















































1, 可 以 在 原因 和 结果 之 间 指 定 一 









































| 算 原 因 的 显著 性 。 如 果 与 流感 病人 亲密 接触 后 ， 








接触 者 会 在 1 到 4 天 出 现 流感 症状 , 那么 这 个 时 间 条 件 就 能 让 我 们 计算 出 
二 者 之 间 的 因果 显著 性 值 。 但 如 果 我 们 对 引起 流感 的 原因 一 无 所 知 , 怎样 
才能 知道 只 要 测试 这 个 时 窗 就 可 以 了 呢 ? 这 些 测量 方法 中 的 某 些 方法 存 








在 一 个 缺点 , ABS 


















































it 是 如 果 测 试 的 时 间 组 不 对 , 我 们 可 能 就 会 错过 一 些 真正 


的 原因 , 或 者 只 能 找到 真正 时 间 组 的 一 个 子 集 。 我 们 不 能 为 了 解决 这 个 问 
题 而 去 测试 每 一 个 我 们 能 想到 的 时 间 间 隔 ， 因 为 这 样 会 大 大 增加 计算 的 复 


ARTE, ME 
为 这 些 数据 样本 放 


据 量 很 少 
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[这 种 做 法 也 无 法 保证 我 们 在 实践 中 一 定 会 找到 正确 的 时 间 组 合 。 
F 不 是 随 着 时 间 而 均匀 分 布 的 ， 它 们 可 能 十 分 分 散 ( 数 
且 间 隔 的 时 间 很 长 )， 并 且 数 据 之 间 的 间隔 可 能 也 不 是 随机 的 。 





假设 我 们 有 一 组 病人 的 一 些 实验 检测 结果 以 及 他 们 的 药物 处 方 。 即 


使 某 种 药物 会 在 一 周 之 内 导致 病人 血 

















I 糖 升 高 , 那 我 们 测试 出 来 的 数据 也 不 
会 全 部 ( 甚至 也 不 会 是 大 多 数 ) 取 自 处 方 开 出 后 整整 一 周 的 时 候 。 此 外 ， 
开 处 方 的 日 期 和 服药 的 日 期 之 间 可 能 也 会 有 一 个 间隔 。 所 以 从 表面 上 来 














看 , 开 处 方 和 血糖 升 高 之 间 的 时 间 间 隔 好 像 延 长 了 , 但 也 许 实际 服药 和 血 
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糖 升 高 之 间 的 时 间 间 隔 真 的 只 有 一 周 。 所 以 , 我 们 在 每 一 个 时 间 间 隔 观 察 
的 数据 可 能 还 不 够 多 。 使 用 时 窗 有 助 于 我 们 计算 显著 性 值 ( 因为 如 果 将 这 
些 时 间 间 隔 统 一 放 在 一 起 , 那 我 们 大 约 观察 5 到 10 天 可 能 就 够 了 ), 但 我 
们 还 需要 搞 清楚 一 个 问题 ， 到 底 要 测试 哪 一 个 时 窗 ? 

要 想 从 数据 中 找到 时 窗 ， 可 以 先 确 定 一 个 可 能 的 时 间 段 或 者 备 选 时 
间 段 ,然后 再 根据 数据 调整 这 个 时 间 段 。 显 著 性 指标 可 以 帮助 我 们 实现 这 
一 点 。 在 图 6-10 中 ,我 们 测试 的 时 窗 与 真正 的 时 窗 重合 了 一 部 分 ， 但 也 
有 不 一 样 的 地 方 ,图 中 所 列 的 就 是 各 种 可 能 出 现 的 情况 。 随 着 时 窗 的 放大 、 
小 和 偏离 ， 我 们 要 重新 计算 因果 显著 性 的 值 。 在 每 一 种 情况 下 ,把 不 正 
的 时 窗 改 变 得 更 加 接近 真实 的 时 窗 ， 显 著 性 的 值 都 会 变 大 。 有 了 时 窗 ， 
结果 变量 本 质 上 就 成 了 在 某 个 时 间 范 围 内 出 现 的 结果 。 如 果 测 试 的 时 窗 比 
真实 的 时 窗 宽 得 多 ( 如 图 6-10 中 的 第 一 个 长 条 形 所 示 )， 那么 就 会 出 现 很 
多 这 样 的 情况 : 我 们 很 期 待 某 个 结果 出 现 , 但 是 这 个 结果 却 没有 出 现 (由 
于 在 原因 为 真 的 情况 下 结果 并 未 出 现 , 所 以 这 些 案例 会 对 原因 的 显著 性 值 
造成 不 利 影响 )。 另 一 方面 ， 如 果 测 试 的 时 窗 太 罕 ， 那 么 即便 测试 的 潜在 
原因 没有 出 现 , 某 个 结果 可 能 也 会 出 现 。 随 着 测试 时 窗 与 真实 时 窗 越 来 越 
接近 ， 显 著 性 值 也 会 变 大 ， 并 且 最 终 会 与 真实 的 显著 性 值 相 一 致 。” 












































ay 
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太 宽 
偏离 
KA 
真实 的 时 窗 [ER 
图 6-10” 当 一 个 原因 的 测试 时 窗 与 真实 时 窗 有 
的 地 方 时 ， 可 能 出 现 的 各 种 情形 



































EE 合 的 地 方 也 有 不 同 





iml 




















6.3.2” 格 兰 杰 因果 关系 检验 法 
概率 主要 用 于 包含 离散 事件 的 数据 ， 例 如 已 诊断 或 未 诊断 ， 或 者 被 














划分 为 正常 、 偏 高 和 
化 是 如 何 导 致 男 一 

真正 想 知道 的 不 是 一 只 
而 是 另 一 只 
事件 出 现 的 概率 发 和 9 
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jar 























股票 








以 这 样 用 。 


严格 来 说 ， 
很 快 就 会 看 到 原因 ), 但 它 却 是 在 连续 值 时 间 
常用 方法 。Wiener 曾 














CENAE 





股票 的 交易 量 发 4 


低 的 化 验 值 。 但 如 果 我 们 想 知道 一 
E 变 化 的 , 又 该 怎么 办 呢 ? 其 实 我 们 





的 价格 上 涨 会 导致 男 一 


生 的 变化 , 某 个 变量 的 值 会 发 4 





E 多 大 的 变化 。 





关系 ”并 不 是 传统 意义 上 


序列 


Aas 


ABE 
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uP, 





只 股票 的 价格 变 


票 的 交易 量 上 升 ， 


4 股票 的 交易 量 预计 会 增加 多 少 。 试 的 是 某 个 原因 会 导 
E 多 大 的 变化 , 但 我 们 也 可 以 测试 相对 于 原因 发 


加 的 大 部 分 方法 都 可 

















WAKA 
数据 中 推 


RA (FR 
理 因 果 关 系 的 




















经 说 过 ， 


研究 基础 之 上 , 格 兰 杰 设 计 出 了 


( 比如 股票 收益 率 ) 中 的 因果 关系 。 这 个 方法 的 基本 思路 是 ， 
量 没有 的 关于 结果 的 信息 , 这 些 信 ， 
的 值 。 所 以 ， 假 设 我 们 掌握 了 某 个 时 刻 之 前 的 所 有 信 ， 


提供 了 一些 其 他 变量 
TUE aE 











原因 提 JEJ EE 


RAY 





预测 性 。 在 Wiener 的 





一 个 实用 的 方法 ， 





























这 种 情 况 下 > ang 

















概率 就 会 发 生变 化 。 


在 实践 中 ， 我 们 掌握 的 信息 


我 们 将 原因 从 这 些 信 息 














, 也 会 


























& m 


BOHR TENA ABLE A 


息 并 不 是 无 限 的 ， 
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HE, 
No 








能 做 什么 。 
第 一 种 形式 的 格 兰 杰 因 果 关 系 叫 作 双 变量 格 兰 杰 因 果 关 系 ， 这 种 因 


果 关 系 比 相关 性 强 不 了 多 少 〈 它 上 
是 只 能 告诉 我 们 一 
们 在 监测 天 气 情 况 、 航 班 晚点 事 伯 

















ELA 
个 变量 是 
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能 帮助 我 人 
F 和 机 场 咖啡 的 销 


种 都 能 让 你 得 出 授 











用 于 测试 金融 时 间 序 列 
原因 给 我 们 
息 可 以 让 我 们 更 好 地 
B, 在 


Ds 

















中 剔除 掉 , 那么 结果 为 某 个 值 的 





即便 我 们 掌握 了 所 有 信 


1 于 计算 的 复杂 性 而 无 法 将 它们 都 派 上 用 场 。 总 的 来 说 ， 有 两 种 
式 的 格 兰 杰 因果 关系 ， 每 


然 不 同 的 结论 。 值 得 注 














意 的 是 , 这 两 种 形式 的 因果 关系 都 不 是 真正 的 因果 关系 。 但 由 于 它们 经 常 





的 值 不 是 对 称 的 
] 预 测 男 一 


We 











主张 ,所 以 还 是 有 必要 了 解 一 下 它们 能 做 什么 以 及 不 








)。 它 只 有 两 个 变量 ， 而 
一 个 变量 。 所 以 , 如 果 我 


DHE o 
AN AR 


E. 
DZE 
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只 能 发 现 两 
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之 间 的 关系 ,比如 天 气 情 况 可 以 预测 航班 晚点 事件 。 即 便 是 在 没有 隐藏 变 
量 的 情况 下 使 用 这 个 方法 , 也 无 法 避免 混乱 的 局 面 。 所 以 ， 双 变量 格 兰 杰 
因果 关系 很 容易 让 我 们 在 由 共同 原因 导致 的 各 个 结果 之 间 发 现 并 不 存在 
的 虚假 因果 关系 。 如 果 恶 劣 的 天 气 导 致 飞机 和 火车 都 晚点 了 , 那 我 们 可 能 
会 错误 地 认为 是 飞机 晚点 导致 了 火车 晚点 ,或 者 是 火车 晚点 导致 了 飞机 晚 
点 。 这 种 方法 还 可 能 会 让 人 们 认为 ,在 一 连 串 的 原因 中 , 是 前 几 个 原因 导 
致 了 所 有 后 来 出 现 的 原因 , 而 不 再 是 只 发 现 各 个 原因 之 间 直 接 的 关系 。 也 
就 是 说 , 如 果 我 们 有 一 个 事件 序列 , 由 于 我 们 无 法 考虑 序列 中 间 的 各 个 事 
件 ， 所 以 可 能 会 认为 是 第 一 个 事件 引起 了 最 后 一 个 事件 。 
用 来 测试 格 兰 杰 因果 关系 的 方法 有 很 多 ， 回 归 分 析 就 是 其 中 一 个 简 
单 的 方法 。 假 设 我 们 想 知道 是 先 有 鸡 还 是 先 有 和 蛋 。 沿 着 Thurman 和 Fisher 
的 思路 , 我 们 选取 了 两 个 时 间 序 列 , 一 个 是 每 年 鸡蛋 的 产量 , 另 一 个 是 每 
年 鸡 的 数量 。 然 后 , 我 们 会 得 出 两 个 等 式 : 一 个 表示 鸡 的 数量 如 何 取决 于 
之 前 鸡 和 鸡蛋 的 数量 , 男 一 个 表示 的 是 鸡蛋 的 数量 如 何 取 决 于 之 前 鸡 和 鸡 
蛋 的 数量 。“ 之 前 ”具体 是 指 之 前 几 年 (时 间 间 隔 或 时 窗 )， 这 个 数字 是 由 
用 户 选 择 的 一 个 参数 。 我 们 可 以 测算 出 某 一 年 鸡蛋 的 产量 和 前 一 年 (或 者 
前 两 年 , 等 等 ) 鸡 的 数量 之 前 的 依赖 程度 ， 有 一 个 系数 可 以 告诉 我 们 当前 
鸡 和 鸡蛋 的 数量 与 之 前 某 一 年 鸡 和 鸡蛋 数量 之 间 的 依赖 程度 有 多 强 , 系数 
为 零 意 味 着 没有 任何 依赖 关系 。 因 此 , 在 鸡蛋 等 式 中 ， 如果 鸡 的 数量 系数 
在 某 个 时 间 段 不 是 零 , 那么 鸡 和 鸡蛋 之 间 就 存在 格 兰 杰 因 果 关 系 ( 如 果 之 
前 某 一 年 的 系数 刚好 是 2, 那么 这 就 意味 着 当前 鸡蛋 的 数量 正好 是 之 前 某 
一 年 鸡 的 数量 的 两 倍 )。 一 般 情况 下 ， 更 多 的 时 间 间 隔 意味 着 更 高 的 复杂 
程度 , 所 以 除了 数据 ( 比如 数据 点 的 数量 和 测量 的 粒度 ) 上 的 局 限 性 以 外 ， 
在 实际 测量 的 内 容 上 可 能 也 有 一 定 的 局 限 性 。 
让 我 们 再 次 回 到 机 场 。 假 设 我 们 在 预测 咖啡 销量 时 考虑 了 天 气 因素 、 
航班 晚点 和 之 前 的 咖啡 销量 , 这 就 成 了 多 变量 格 兰 杰 因果 关系 。 在 这 种 因 
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果 关 系 中 , 每 一 次 测试 都 包含 了 所 有 的 变量 。 尽管 我 们 无 法 将 世界 上 所 有 
的 信息 都 考虑 进去 , 但 是 将 所 有 的 其 他 因素 都 考虑 进去 之 后 , 就 能 测试 出 
某 个 变量 是 否 能 提供 一 些 有 用 的 信息 。 假设 真正 的 关系 是 这 样 的 : RTE 
劣 导致 航班 晚点 , 航班 晚点 导致 候 机 时 间 延 长 ,而 候 机 时 间 延 长 又 导致 咖 
啡 销量 上 升 。 那 么 ,一旦 在 咖啡 等 式 中 加 入 了 航班 晚点 这 个 因素 ， 天 气 情 
况 就 无 法 再 为 我 们 提供 任何 新 的 信息 了 , 因此 , 它 的 系数 应 该 接近 于 零 ( 即 
它 对 预测 咖啡 销量 不 再 会 有 任何 帮助 )。 在 实践 中 ， 我 们 不 会 只 因为 系数 
不 为 零 就 真 的 认为 变量 之 间 存 在 因果 关系 , 而 会 做 一 些 测试 来 看 看 这 个 不 
为 零 的 系数 在 统计 学 上 是 否 具 有 显著 性 。 尽管 多 变量 格 兰 杰 因果 关系 更 加 
接近 因果 关系 , 但 我 们 无 法 保证 发 现 的 这 些 关 系 一 定 是 真实 的 。 更 关键 的 
是 , 尽管 多 变量 格 兰 杰 因果 关系 更 有 力也 更 准确 , 但 由 于 它 的 计算 强度 大 
大 ， 所 以 实际 使 用 它 的 次 数 很 少 。” 
































































































































6.4 现在 该 怎么 办 

















或 许 你 身上 戴 着 活动 监视 器 ， 搜 集 了 好 几 个 月 的 运动 和 睡眠 数据 ; 
或 许 你 从 你 们 小 区 的 报案 记录 中 得 到 了 一 些 数据 ， 想 从 中 找到 犯罪 的 原 
; 或 许 你 看 到 有 人 从 社交 媒体 的 帖子 中 发 现 了 当地 流感 的 流行 趋势 。 那 
么 ， 你 该 如 何 着 手 分 析 你 搜集 到 的 数据 呢 ? 

因果 推理 的 方法 不 止 一 种 ， 一 定 要 认识 到 这 一 点 。 目 前 还 没有 哪 一 
种 方法 能 够 在 所 有 案例 中 都 准确 无 误 地 找到 事件 之 间 的 因果 关系 ( 这 就 让 
我 们 有 了 很 多 研究 的 机 会 )。 有 些 方 法 得 出 的 结论 更 具 普 遍 性 , 但 是 这 些 
结论 取决 于 那些 实际 上 不 一 定 为 真 的 假设 。 只 知道 一 种 寻找 因果 关系 的 方 
并 孜孜 不 倦 地 用 它 来 解决 每 一 个 问题 是 不 行 的 , 我们 需要 的 是 一 个 工具 
箱 。 大 部 分 方法 都 可 以 通过 调整 来 适应 大 部 分 案例 , 但 调整 后 的 方法 既 不 
是 最 简便 的 ， 也 不 是 最 有 效 的 。 
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没有 一 种 方法 是 完美 的 ， 所 以 一 定 要 了 解 每 一 种 方法 的 局 限 性 。 比 
如 说 , 如 果 你 的 推理 是 建立 在 双 变 量 格 兰 杰 因 果 关 系 基 础 之 上 的 , 那么 你 
应 该 意识 到 , 你 找到 的 只 是 一 种 单 向 相关 性 , 同时 还 应 该 考虑 一 下 多 变量 
的 方法 。 如 果 因 果 结 构 ( 变量 之 间 的 联系 ) 是 已 知 的， 而 我 们 想 要 从 一 些 
数据 中 找 出 这 个 结构 的 各 种 参数 ( 概率 分 布 )， 这 时 贝 叶 斯 网 络 也 许 是 一 
个 很 好 的 选择 。 但 是 , 如 果 时 间 是 其 中 一 个 重要 变量 , 那么 使 用 动态 贝 叶 
斯 网 络 或 考研 究 因果 关系 时 间 变 量 的 方法 可 能 更 合适 。 此 外 , 我 们 研究 的 
数据 是 离散 的 还 是 连续 的 也 会 限制 我 们 所 使 用 的 方法 , 因为 很 多 方法 只 能 
适用 于 其 中 一 种 类 型 的 〈 而 不 是 两 者 都 适用 ) 数据 。 如 果 数 据 中 包含 大 量 
变量 , 或 者 我 们 并 不 需要 找 出 完整 的 关系 结构 , 那么 用 于 计算 因果 关系 强 
度 的 方法 比 推理 因果 模型 的 方法 的 效率 要 更 高 。 但 在 使 用 这 些 方法 时 , 还 
要 考虑 是 否 需 要 建立 原因 之 间 相 互 作用 的 模型 , 以 便 我 们 能 够 预测 各 种 结 
果 。 因 此 , 在 决定 使 用 哪些 方法 时 ,原因 的 用 途 和 已 有 数据 同样 重要 。 最 
后 还 要 认识 到 一 点 : 在 搜集 和 准备 数据 的 过 程 中 , 我 们 所 做 的 所 有 选择 都 
会 对 最 终 推理 出 来 的 结论 产生 影 


注释 


. FDA 不 良 事件 上 报 系统 (AERS )。 

. Tatonetti 等 (2011 )。 

. Tatonetti 等 (2011 )。 

一 个 重要 的 方法 是 快速 因果 推理 法 (通常 缩写 为 FCI )。 想 要 了 解 更 多 详 

细 人 信息， 参见 Spirtes 等 ( 2000 )。 也 有 一 些 研 究 曾 将 快速 因果 推理 法 进行 

扩展 ， 以 此 来 分 析 时 间 序 列 数据 (Eichler, 2010; Entner 和 Hoyer, 2010 )。 

5. Meek (1995 ); Spirtes (2005 )。 

6. 想 要 了 解 更 多 信息 ,参见 Andersen (2013 )。 

7， 人 们 除了 尽量 让 数据 稳定 之 外 ， 还 提出 了 几 个 专门 用 来 推理 非 稳 定性 时 间 
序列 的 方法 。 想 要 了 解 这 方面 的 例子 ， 参 见 Grzegorczyk 和 Husmeier 

(2009 ); Robinson 和 Hartemink ( 2010 )。 
8， 关 于 这 方面 的 例子 ， 参见 Pivovarov 和 Elhadad (2012 )。 
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关于 这 一 研究 的 回顾 ， 参 见 Scheines (1997 )。 
这 个 问题 在 哲学 领域 有 一 些 争 议 。 想 要 了 解 与 这 一 看 法 对 立 的 观点 ， 参 见 
Cartwright (2001, 2002 ); Freedman 和 Humphreys ( 1999 )。 




















. 想 要 了 解 更 多 关于 贝 叶 斯 网 络 的 信息 ， 人 参见 Charniak (1991 )。 

.也 就 是 P (B, A) = P (B| A P(A) o 

. 想 要 了 解 更 多 关于 动态 贝 叶 斯 网 络 的 信息 ， 参 见 Murphy (2002 )。 

. 想 要 了 解 关 于 软件 的 综述 ， 参 见 Kevin Murphy AX “Software Packages for 




















Graphical Models” 的 内 容 。 














. Cooper 和 Herskovits ( 1992 ) 描述 了 一 个 这 种 类 型 的 早期 方法 。 
.常见 的 就 是 贝 叶 斯 信息 标准 ( Schwarz，1978 )。 

. Cooper ( 1999 )。 

.参见 美国 联邦 储备 委员 会 官网 。 

. 随 着 变量 数量 的 增加 ， 可 能 出 现 图 形 的 数量 会 呈 超 指数 级 增长 。 

. Cooper 和 Herskovits ( 1992 )。 男 一 种 办 法 就 是 定期 使 用 一 种 新 的 、 随 机 产 



































生 的 图 形 重新 进行 检索 。 











.一 种 基于 限制 的 方法 就 是 FCI ( Spirtes 等 ，2000 )。 
. 想 要 了 解 关 于 贝 叶 斯 网 络 的 更 多 内 容 ， 参 见 Cooper (1999 ); Spirtes 等 

















( 2000 )。 


. Kleinberg ( 2012 )。 

.在 Fitelson 和 Hitchcock (2011 ) 中 有 一 个 关于 这 一 内 容 的 研究 综述 

. Eells (1991 ) 在 处 理 原 因 显著 性 的 平均 度 时 正 是 这 样 做 的 。 

.Kleinberg ( 2012 ) 的 研究 正 是 使 用 了 这 个 方法 。 注 意 , 在 Kleinberg ( 2012 ) 






































的 研究 中 ， 原 因 可 能 要 比 变 量 更 为 复杂 ， 而 且 可 能 包含 一 段 时 间 内 的 真实 
事件 序列 或 属性 。 
参见 Kisinberg (2012 ) 第 4 章 和 第 6 章 的 内 容 ， 以 获取 更 多 关于 计算 原因 
显著 性 ， 以 及 如 何 选择 临界 值 来 确定 某 个 数值 在 统计 学 上 是 否 具有 显著 意 
义 的 内 容 。 

想 要 了 解 更 多 关于 这 方面 的 信息 , 参见 Kleinberg( 2012 ) 和 Efron( 2010 )。 
如 何以 数据 推动 的 方式 找到 因果 关系 中 的 时 间 间 隔 ? 想 要 了 解 更 多 这 方 
面 的 信息 ， 参 见 Kleinberg (2012 ) 第 5 章 。 

参见 原文 (Granger, 1980 )。 































































































工具 箱 。 在 很 多 平台 中 (包括 R Al MATLAB 平台 ) 都 有 双 变 量 因果 关系 
检验 。 


第 7 章 实验 法 


如 何 通 过 对 人 和 系统 进行 干预 来 寻找 原因 ? 





与 健康 有 关 的 很 多 说 法 似乎 都 经 不 起 时 间 的 检验 ， 最 终 发 生 了 逆转 。 
最 令 人 震惊 的 逆转 之 一 是 我 们 对 激素 替代 疗法 CART ) 和 心脏 病 发 作 之 间 
关系 的 认识 : 早期 的 研究 发 现 ，HRT 可 以 预防 心脏 病 发 作 ， 但 后 来 的 研 
究 却 发 现 ，HRT 对 预防 心脏 病 没 有 任何 效果 ， 其 至 会 提高 心脏 病 发 作 的 
概率 。 

关于 ART 好 处 的 第 一 份 证 据 取 自 护士 健康 研究 (NHS )。' 该 研究 调 
查 了 一 个 巨大 的 注册 护士 群体 ( 近 122 000 人 )， 产 生 了 一 定 的 影响 。 第 一 
次 护士 健康 调查 发 生 在 1976 年 ， 此 后 每 两 年 对 这 些 护士 进行 一 次 跟踪 调 
查 。 人 们 在 分 析 了 1997 年 的 调查 数据 之 后 发 现 ， 绝 经 后 使 用 HRT 的 护 
士 的 死亡 风险 比 其 他 护士 要 低 37%, 而 这 主要 是 因为 这 个 护士 群体 中 死 于 
冠 心病 的 人 数 比 其 他 护士 群体 要 少 得 多 。 

后 来 出 现 了 一 些 指导 原则 ， 表 示 可 以 使 用 HRT 来 降低 患 冠 心 病 的 风 
o 但 就 在 护士 健康 研究 公布 其 发 现 的 一 年 之 后 ， 就 有 人 发 表 了 另 一 项 
研究 ， 声 称 HRT 对 冠 心病 没有 任何 疗效 。 与 护士 健康 研究 不 同 ， 心 脏 和 
雌 激素 / 孕 激 素 奉 代 研 究 (HERS ) 试验 "不 是 只 观察 人 们 的 行为 ， 而 是 将 
病人 随机 分 成 两 组 , 一 组 使 用 HRT, 另 一 组 只 服用 安奈 剂 。 尽 管 这 项 研究 
只 对 2763 名 女性 进行 了 为 期 四 年 的 跟踪 人 研究, 却 对 护士 健康 研究 的 结论 提 














































































































出 了 一 些 质疑 ， 因 为 在 研究 的 第 一 年 ， 使 用 HRT 的 实验 组 的 心脏 病 发 病 
率 不 降 反 升 ( 这 一 结果 在 最 后 两 年 被 逆转 了 )。 女 性 健康 研究 (WHI) 的 
随机 对 照 试 验 招募 了 一 个 更 大 的 参与 者 群体 ， 想 要 研究 HRT 对 女性 的 长 
期 影响 ， 计 划 的 平均 跟踪 研究 周期 为 8.5 年 。 虽 然 因 为 参与 者 群体 中 乳腺 
癌 的 发 病 率 出 现 了 显著 增长 ， 这 项 研究 在 平均 研究 周期 达到 5.2 年 后 被 
止 了 , 但 是 研究 人 员 发 现 了 一 个 不 可 思议 的 现象 : 参与 者 的 心脏 病 发 病 率 
提高 了 29% (从 每 1 万 人 1 年 中 有 30 起 心脏 病 发 作 事件 增加 到 了 37 起 )“ 

HRT 似乎 既 可 以 加 大 女性 心脏 病 发 作 的 风险 ， 又 可 以 降低 女性 心脏 
病 发 作 的 风险 , 这 是 怎么 回 事 呢 ? 这 是 由 不 同 的 研究 方式 导致 的 。 护 士 健 
康 研 究 针 对 的 是 一 个 特殊 群体 ， 并 且 定 时 记录 了 HRT 对 参与 者 的 影响 、 
参与 者 所 服用 的 药物 以 及 其 他 情况 。 在 这 种 观察 性 研究 中 , 我 们 并 不 知道 
这 些 结果 是 否 由 某 种 药物 导致 , 也 不 知道 是 否 存 在 某 个 共同 的 原因 导致 参 
与 者 选择 了 某 种 治疗 方案 并 出 现 了 更 好 的 结果 一 一 也 许 是 由 于 护士 们 对 
自身 健康 的 关心 导致 她 们 选择 了 HRT 并 且 心 脏 病 发 作 的 风险 也 降低 了 。 
相反 ， 随 机 试验 可 以 排除 病人 特征 和 治疗 方案 之 间 的 所 有 规律 性 。 

干预 措施 常 被 视 为 检验 因果 推理 活动 的 黄金 准则 。 如 果 我 们 能 够 采 
取 干 预 措施 , 并 将 参与 者 随机 分 到 不 同 的 实验 小 组 中 去 ( 这 里 的 实验 小 组 
既 可 能 是 接受 治疗 的 病人 , 也 可 能 是 被 指定 要 采用 特定 股票 交易 策略 的 股 
票 交易 人 ), 那 我 们 在 一 开始 就 能 排除 很 多 可 能 会 导致 人 们 选择 某 个 干预 措 
施 或 策略 的 干扰 因素 。 然 而 ,实际 情况 要 复杂 得 多 ,因为 我 们 并 不 总 是 能 
够 采取 干预 措施 , 而 且 干 预 措施 可 能 还 会 带 来 一 些 副作用 ,比如 说 服用 降 
胆固醇 药物 的 人 可 能 不 会 那么 注意 自己 的 饮食 。 这 一 章 将 考察 如 何 通过 实 
验 研 究 来 帮助 我 们 寻找 原因 , 以 及 为 什么 一 些 声称 找到 了 因果 关系 的 研究 
可 能 无 法 重 现 , 还 会 考察 一 个 一 般 性 的 问题 : 为 什么 单独 对 一 个 事物 采取 
干预 措施 如 此 困难 ? 最 后 , 我 们 还 会 讨论 一 些 案例 , 看 看 为 什么 干预 措施 
有 时 会 让 人 们 对 事件 背后 的 因果 关系 产生 错误 的 认识 。 
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7.1 ”从 干预 措施 中 获取 原因 


假设 你 想 知道 哪 一 种 肥料 能 让 你 的 植物 长 得 最 好 。 你 先 试 了 肥料 A, 
然后 发 现 你 的 玫瑰 没有 开花 。 你 又 试 了 试 肥料 B, 然后 你 的 花园 突然 充满 
了 生机 ， 于 是 你 就 确信 这 一 切 都 归功 于 肥料 B 一 一 那 种 神奇 的 肥料 。 

这 个 方法 的 问题 是 什么 呢 ? 第 一 个 问题 在 于 你 期 望 的 结果 一 一 长 得 
“最 好 ”一 一 是 主观 性 的 。 也 许 肥料 B 的 价格 是 肥料 A 的 两 倍 ， 所 以 你 想 
相信 肥料 B 的 效果 比 肥料 A 好 ， 又 或 者 你 希望 便宜 的 肥料 和 贵 的 肥料 一 
样 好 。 无 论 是 哪 一 种 情况 ， 这 些 先 验 的 信念 都 可 能 影响 你 对 结果 的 判断 
(参见 第 3 章 介 绍 的 证 实 性 偏差 )。 

假设 我 们 要 通过 量化 评估 来 解决 这 些 问题 。 我 们 可 以 数 一 数 直 径 在 
两 英寸 以 上 的 玫瑰 花 的 数量 并 记录 植株 的 高 度 。 但 是 在 这 两 个 实验 中 , 我 
们 用 的 是 花园 中 的 同一 块 地 ,所 以 我 们 在 使 用 肥料 B 时 看 到 的 变化 可 能 是 
肥料 A 的 延迟 效应 。 这 是 在 测试 药物 、 饮 食 和 其 他 干预 措施 的 效果 时 经 
常 需要 考虑 的 因素 。 在 交叉 研究 中 , 人 们 用 同一 个 个 体 分 别 测试 了 A 和 B 
两 种 干预 措施 。 在 这 个 过 程 中 ,实验 的 顺序 可 能 会 影响 实验 结果 ， 而 且 在 
评估 B 的 效果 时 ， 可 能 还 会 出 现 A 的 剩余 效应 。 比 如 说 ， 服 用 营养 补充 剂 
后 , 该 补充 剂 可 能 会 在 血液 中 停留 一 段 时 间 。 这 时 , 我 们 需要 在 一 个 干预 
活动 结束 和 另 一 个 干预 活动 开始 之 间 留 有 间隔 , 以 便 在 评估 第 二 个 干预 措 
施 的 效果 时 ,可 以 排除 第 一 个 干预 措施 的 遗留 效应 。 最后， 由 于 这 两 种 肥 
料 并 不 是 同时 测试 的 , 所 以 也 有 可 能 在 这 两 个 时 间 段 之 间 还 有 其 他 因素 发 
生 了 改变 。 也 许 在 测试 第 二 种 肥料 时 ， 雨 水 增多 了 或 者 日 照 时 间 变 长 了 ， 
所 以 植物 的 生长 环境 变 得 更 好 了 。 那么 , 这 些 植物 的 任何 改善 可 能 都 是 由 
使 用 肥料 A 和 肥料 B 这 两 个 时 间 段 之 间 发 生 的 变化 引起 的 。 

无 论 是 用 干预 措施 来 比较 不 同 的 原因 ， 还 是 用 它 来 搞 清楚 某 个 事物 
到 底 是 不 是 导致 结果 的 原因 , 其 实 我 们 真正 想 知道 的 是 , 在 所 有 其 他 变量 












































































































































































































































都 保持 不 变 的 情况 下 , 如 果 增 加 或 者 去 掉 某 个 可 能 的 原因 会 出 现 什么 结果 。 

从 直觉 上 来 讲 ， 原 因 和 干预 措施 之 间 存 在 一 定 的 联系 ， 因 为 我 们 经 
常 把 原因 当 作 让 事件 发 生 的 策略 。 而 之 所 以 想 要 找到 具体 的 原因 , 是 因为 
我 们 希望 通过 操纵 原因 来 实现 对 结果 的 操控 。 使 用 观察 数据 来 寻找 原因 的 
一 个 难题 是 , 在 有 些 情 况 下 , 可 能 很 难 将 由 共同 原因 导致 两 个 结果 的 关系 
结构 和 由 一 连 串 原因 构成 的 关系 结构 区 分 开 来 .比如 说 , 在 第 一 种 情况 下 ， 
某 个 政治 候选 人 的 演说 可 能 会 让 他 的 人 气 更 高 并 募 得 更 多 的 苋 选 捐款 ; 而 
在 第 二 种 情况 下 ,竞选 演说 可 能 只 会 让 他 的 人 气 更 高 , 而 人 气 的 上 升 又 导 
致 他 募 得 更 多 的 捐款 。 如 果 我 们 能 够 独立 操控 捐款 额 和 人 气 这 两 个 变量 ， 
就 很 容易 将 这 两 种 可 能 出 现 的 因果 结构 区 分 开 来 。 在 第 一 种 情况 下 , 增加 
人 气 并 不 是 获得 更 多 竞选 捐款 的 好 办 法 〈 它 们 之 间 只 有 相关 性 )， 而 在 第 
二 种 情况 下 , 增加 人 气 可 以 让 竞选 者 获得 更 多 的 竞选 捐款 ( 因为 人 气 可 以 
直接 导致 竞选 捐款 额 的 增长 )。 

由 于 存在 这 样 一 种 联系 ， 有些 人 曾 试图 从 干预 措施 的 角度 来 界定 因 
果 关 系 。 大 致 来 说 ， 用 正确 的 方式 来 改变 原因 会 导致 结果 发 生变 化 。 当 
然 , 这 种 “正确 的 方式 ”还 包括 我 们 不 会 让 产生 某 种 结果 的 其 他 原因 出 现 ， 
也 不 会 直接 让 结果 本 身 出 现 。 相反 , 我 们 想 要 确保 只 有 原因 才能 对 结果 产 
生 影 响 , 以 及 干预 措施 不 会 对 结果 产生 直接 影响 或 者 通过 让 其 他 原因 起 作 
用 的 方式 以 菏 种 方法 绕 开 原因 。 

假设 演说 、 人 气 和 捐款 额 之 间 的 关系 如 图 7-1a 所 示 。 为 了 测试 虚线 
连接 的 两 个 变量 之 间 是 否 存 在 真实 的 因果 关系 , 我 们 可 以 通过 干预 措施 来 
增加 人 气 , 以 便 观察 人 气 上 升 是 否 会 对 捐款 额 产生 影响 。 但 这 一 干预 措施 
可 能 也 会 导致 知名 度 的 上 升 , 从 而 直接 导致 捐款 额 的 上 升 , 而 不 是 通过 影 
响 人 气 而 直接 导致 捐款 和 额 的 上 升 。 在 图 7-1b 中 ,知名度 直接 影响 了 捐款 
额 。 同 样 ， 在 图 7-lc 中 ， 知 名 度 通 过 让 竞选 者 的 演说 机 会 增加 而 间接 导 
致 捐款 额 的 上 升 。 在 第 一 种 情况 下 , 干预 措施 直接 导致 某 种 结果 ; 但 在 第 
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二 种 情况 下 ， 干 预 措施 导致 另 一 个 与 干预 目标 不 同 的 原因 起 了 作用 。 这 
两 种 情况 都 存在 这 样 一 个 问题 : 干预 措施 都 是 以 另外 一 种 方式 导致 某 种 
结果 出 现 的 ， 而 不 是 直接 通过 要 测试 的 原因 。 
































演说 演说 
捐 
Rs 款 人 气 -----------> 捐款 额 
演说 ü 
pa tres sa 知名 度 
(a) 假设 的 关系 结构 (b) 干预 措施 直接 (c) 干预 措施 间接 
导致 某 种 结果 导致 某 种 结果 











图 7-1 点 线 箭 头 标 出 的 联系 是 被 测试 的 关系 结构 。 在 其 他 图 形 中 ， 
实 线 箭头 是 起 作用 的 箭头 ， 虚 线 箭 头 是 不 起 作用 的 箭头 























7.2 ”随机 对 照 试验 














以 上 述 那 种 理想 化 的 方式 操控 一 个 变量 是 很 难 的 。 随 机 对 照 试验 
( RCT ) 解决 了 这 个 难题 的 一 部 分 。 在 这 种 试验 中 ， 有 两 个 或 两 个 以 上 的 
小 组 , 参与 考 被 随机 分 配 到 各 个 小 组 中 , 所 以 不 同 小 组 之 间 的 唯一 差别 应 
该 就 是 处 理 方式 的 不 同 。 因 为 所 有 其 他 特征 的 分 布 应 该 是 一 样 的 , 所 以 如 
果 出 现 了 不 同 的 结果 , 一 定 是 处 理 方式 不 同 导 致 的 。 这 并 不 是 一 个 “一 键 
安装 ” 式 的 理想 化 干预 措施 ( 比如 增加 钠 元 素 的 摄 人 量 但 不 改变 液体 的 摄 
入 量 )， 但 是 它 却 比 其 他 任何 措施 都 更 加 接近 理想 化 。 

但 在 使 用 RCT 的 结论 时 , 这 种 严格 的 要 求 也 是 一 种 局 限 。 在 试验 中 ， 
我 们 只 考察 一 个 变量 ; 但 是 在 现实 生活 中 ,试验 结论 却 不 一 定 能 这 样 用 。 
比如 说 , 我 们 可 能 在 RCT 中 发 现 某 种 药物 对 我 们 有 益 且 没 有 任何 副作用 ， 
但 在 现实 生活 中 , 人 们 在 服用 这 种 药物 的 同时 可 能 还 会 经 常服 用 另 一 种 药 













































































物 , 这 两 种 药物 之 间 会 出 现 严 重 的 相互 作用 , 而 这 种 相互 作用 可 能 只 有 在 
药物 上 市 之 后 才 会 被 发 现 。 
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颜色 的 徽标 的 网 页 

















R, 对 比 不 同 网 页 


























户 点 击 数据 来 决定 要 在 它 的 徽标 中 使 
! 的 哪儿 个 色 度 。" 通过 将 用 户 或 访客 随机 分 流 到 不 同色 度 的 或 当前 
! 用 户 点 击 徽标 的 次 数 , 从 而 测试 


虽然 RCT 经 常 出 现在 医药 领域 , 但 它们 实际 上 只 是 一 种 实验 研究 方 
法 而 已 , 我 们 完全 可 以 用 这 种 方法 来 研究 很 多 
名 的 案例 : 谷歌 使 用 用 











其 他 领域 的 问题 。 有 一 个 著 
] 41 PRE 


















































出 用 户 对 不 同色 度 的 


传递 什么 样 的 信息 以 及 如 何 传递 这 些 信 息 。 在 政治 竞选 中 ， 人 们 不 再 


找 投票 行为 和 人 口 特征 之 间 的 相关 性 , 也 不 再 提出 一 些 关 于 人 们 如 何 投票 


Hif 政治 竞选 也 使 























的 理论 , 而 是 利用 海量 的 电子 邮件 地 址 和 详细 的 个 人 数据 来 测试 各 种 干预 
措施 的 效果 。 比 如 ,在 某 次 竞选 
机 分 成 不 同 的 小 组 , 给 每 
组 打 不 同 内 容 的 电话 ,以 此 来 争取 他 们 的 捐款 。 
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的 金额 )。 而 且 





























如 果 样 本 足够 大 的 话 ， 我 们 可 以 从 很 多 不 同 的 小 组 








得 捐款 











中 测试 出 很 多 不 同 的 信 
先 在 一 个 比较 小 的 支持 者 群体 
( 例如 不 同 邮件 主题 、 不 同 建议 : 
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巴 马 在 2012 
测试 了 不 














1， 我 们 可 以 将 
个 小 组 发 送 不 同文 本 的 电子 邮件 , 或 者 给 每 个 小 


J 了 随机 对 照 试验 来 决定 向 选民 
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具有 某 些 特 征 的 一 群 人 随 








E de 


试验 的 结果 十 分 清晰 (Se 








年 欧 选 时 正 是 这 样 做 的 ， 他 们 
同 特征 的 电子 邮件 取得 的 效 呈 
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目 球 金额 其 














至 不 同 邮件 格式 等 ), 然后 才 把 


























邮件 发 送 给 通讯 录 











,的 所 有 收 件 人 。 ° 
随 着 时 间 的 推移 ， 通 过 RCT 获得 的 知识 并 不 总 是 一 成 不 变 的 ( 再 次 
使 用 曾经 有 效 的 电子 邮件 还 会 有 效 吗 ), 但 























Æ RCT 已 经 被 广泛 应 用 于 医药 











领域 以 外 的 很 多 领域 ( 比如 经 济 学 和 教育 领域 了 )。 即 便 你 自己 从 来 没有 做 


过 RCT， 能 够 评估 试验 的 结 呈 


为 什么 要 做 随机 试验 


7.2.1 





























对 于 你 的 决策 行为 也 是 十 分 重要 的 。 





18 世纪 初 , James Lind 做 了 一 个 试验 并 将 其 记录 了 下 来 , 这 个 实验 被 
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认为 是 第 一 个 对 照 试验 。 试 验 发 现 , 柑橘 类 水 果 可 以 很 快 治 好 坏 血 病 。 有 
一 艘 船上 的 很 多 水 手 都 得 了 坏 血 病 ，James Lind 将 症状 相似 的 12 名 水 手 


分 成 








6 个 治疗 小 组 。 除 了 要 测试 的 各 种 治疗 方法 以 外 ， 这 6 个 小 组 的 饮 





食 是 完全 一 样 的 。 治 疗 方法 包括 醋 、 海 水 、 柠 檬 和 橘子 。” Lind 发 现 ， 与 
其 他 小 组 相 比 , 食用 了 柑橘 类 水 果 的 治疗 小 组 康复 得 很 快 。 他 由 此 认为 柑 
橘 类 水 果 可 以 有 效 治疗 坏 血 病 。 
然而 , 这 个 实验 中 的 各 个 小 组 使 用 的 治疗 方案 完全 是 由 Lind 安排 的 ， 
而 不 是 随机 分 配 的 。 在 他 的 记录 中 , 采用 海水 治疗 方案 的 那 组 水 手 的 症状 
比 其 他 小 组 要 严重 得 多 。”" 尽管 他 的 结论 后 来 被 证 实 是 正确 的 ， 但 如 果 我 
们 根据 症状 的 严重 程度 来 选择 治疗 方案 , 那么 这 种 区 别 性 待遇 完全 有 可 能 














































































































导致 结果 出 现 偏差 ( 如 果 那 些 采 用 柑橘 类 水 果 治 疗 方案 的 参与 者 是 一 些 症 

















状 较 轻 的 、 无 论 是 否 接受 治疗 都 会 康复 的 病人 ), 或 者 导致 与 辛普森 悖 论 
类 似 的 情形 出 现 ( 如 果 那 些 采 用 柑橘 类 水 果 治 疗 方案 的 参与 者 是 一 些 无 可 
救 药 的 病人 )。 要 想 避 免 在 分 配 治疗 方案 的 过 程 中 出 现 区 别 性 待遇 ，RCT 
中 的 随机 部 分 至 关 重 要 。 

观察 性 研究 的 一 个 主要 缺陷 在 于 ， 人 们 关于 是 否 采取 行动 和 何 时 采 
取 行动 的 选择 会 扰乱 我 们 所 观察 到 的 事物 之 间 的 关系 。 比 如 说 , 我 们 很 难 
测试 玩 暴力 的 电子 游戏 是 否 会 导致 暴力 行为 。 因为 我 们 并 没有 随机 分 配 这 
些 孩 子 去 玩 某 种 类 型 的 游戏 , 所 以 即使 二 者 之 间 存 在 某 种 相关 性 , 我 们 也 
无 法 确定 到 底 是 电子 游戏 导致 了 暴力 行为 , 还 是 暴力 行为 导致 孩子 们 去 玩 
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游戏 ,又 或 者 还 有 一 个 因素 既 导 致 了 孩子 们 的 暴力 行为 , 又 导致 孩 


子 们 去 玩 暴 力 游戏 。 

同 理 ， 在 护士 健康 研究 中 ， 护 士 们 选择 ART 的 行为 与 她 们 面临 患 心 
脏 病 的 风险 以 及 她 们 对 有 益 健 康 的 行为 的 偏好 是 分 不 开 的 。 也 就 是 说 , 有 
可 能 HRT 对 心脏 病根 本 没有 任何 效果 , 可 能 是 那些 选择 HRT 的 护士 们 做 
了 一 些 其 他 的 事情 , 从 而 降低 了 心脏 病 发 作 的 风险 一 一 而 且 有 可 能 是 她 们 










































































选择 HRT 的 行为 给 我 们 提供 了 一 些 关 于 其 他 行为 的 信息 , 这 让 HRT 预测 
到 那些 使 用 这 一 疗法 的 病人 的 身体 状况 会 更 好 。 还 有 一 个 类 似 的 例子 是 ， 
在 所 有 其 他 药物 都 无 效 的 情况 下 , 用 一 些 未 标明 用 途 的 药物 来 对 病人 进行 
治疗 。 这 就 对 病人 采取 了 干预 治疗 ， 因 此 这 些 病人 的 治疗 结果 取决 于 他 
们 疾病 的 严重 程度 、 医 疗 护理 的 质量 ， 等 等 。 之 前 尝试 的 很 多 药物 的 剩 
余 效应 可 能 会 进一步 扰乱 我 们 观察 到 的 关系 , 让 我 们 很 难 确定 某 种 药物 无 
效 的 含义 到 底 是 什么 。 随 机 试验 的 好 处 主要 在 于 , 它 可 以 切断 我 们 的 选择 
( 选择 去 干预 的 行为 ) 和 试验 结果 之 间 的 联系 。 

假设 我 们 将 学 校 里 所 有 13 岁 的 孩子 随机 分 成 两 组 ， 然 后 给 其 中 一 
组 发 信息 ， 督 促 他 们 每 天 进行 30 分 钟 的 体育 活动 ， 而 给 男 一 组 发 送 的 信 
息 内 容 是 天 气 预 报 。 这 两 组 孩子 会 互相 联系 , 但 我 们 无 法 知道 他 们 是 否 会 
相互 分 享 自己 收 到 的 信息 内 容 , 也 无 法 知道 那些 收 到 督促 信息 的 孩子 是 否 
会 邀请 他 们 的 朋友 ( 收 到 天 气 预 报信 息 的 孩子 ) 一 起 参加 体育 活动 。 在 药 
品 的 临床 试验 中 , 干预 组 的 病人 可 能 也 会 跟 对 照 组 的 病人 分 享 他 们 所 服用 
的 药物 。 这 种 小 组 之 间 的 药物 共享 行为 就 是 样本 污染 的 一 个 例子 。" 

为 了 防止 干预 组 和 对 照 组 之 间 出 现 样 本 污染 问题 ， 人 们 采用 了 一 种 
群集 设计 ， 即 随机 分 配 各 个 群体 而 不 是 个 体 。 比 如 说 , 我 们 不 再 对 学 生 进 
行 随机 分 配 , 而 是 将 所 有 学 校 随机 分 成 两 个 小 组 , 给 属于 不 同 小 组 的 学 生 
发 送 不 同 的 信息 。 针 对 药品 临床 试验 的 那个 例子 ， 我 们 不 再 对 病人 进行 
随机 分 组 ， 而 是 将 医院 或 医疗 服务 机 构 随机 分 成 两 个 小 组 ， 每 个 小 组 
的 病人 接受 不 同 的 治疗 方案 。 这 种 做 法 的 前 提 是 样本 的 规模 足够 大 , 这 样 
我 们 才 会 对 试验 结果 的 准确 性 有 同样 的 信心 , 因为 同一 个 群集 中 的 个 体 之 
间 也 许 存 在 一 定 的 相关 性 ,而 且 各 个 群集 的 大 小 可 能 也 不 一 样 。 这 些 群 外 
可 以 是 一 个 家 庭 ( 由 于 基因 和 环境 因素 , 这 个 群集 中 的 个 体 之 间 高 度 相关 ) 
或 者 一 个 学 校 ( 由 于 所 处 位 置 相同 , 这 个 群集 中 的 个 体 之 间 仍 然 存在 相关 
性 ， 但 是 这 种 相关 性 要 比 家 庭 成 员 之 间 的 相关 性 小 得 多 )。 
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无 论 是 随机 将 个 体 分 成 两 个 小 组 还 是 将 群体 分 成 两 个 小 组 ， 这 种 将 
对 象 分 成 两 个 相似 小 组 ( 除了 对 它们 采取 的 干预 措施 不 同 以 外 , 两 个 小 组 
在 各 个 方面 都 是 相似 的 ) 的 指令 忽略 了 很 多 细节 问题 一 一 它 并 没有 告诉 我 
们 这 两 个 小 组 (这 两 个 小 组 不 需要 完全 一 样 , 只 要 它们 之 间 具 有 可 比 性 就 
可 以 了 ) 中 应 该 包括 什么 样 的 成 员 。 因 此 , 我 们 需要 决定 哪些 人 可 以 作为 
研究 对 象 。 

假设 我 们 正在 测试 用 于 治疗 胃 灼 热 的 药物 。 我 们 可 以 招募 各 个 年 龄 
段 的 不 同性 别 的 人 参加 测试 ， 但 是 这 些 人 中 的 很 多 人 可 能 都 没有 患 胃 灼 
热 。 由 于 研究 资金 和 研究 周期 都 有 限 ， 这 样 招募 参与 考 会 浪费 很 多 资源 ， 
而 且 大 部 分 没有 患 胃 灼热 的 人 很 可 能 也 不 愿意 参加 这 样 的 测试 。 假 设 我 们 
缩小 参与 者 的 招募 范围 ， 只 招 那些 曾经 得 过 胃 灼 热 的 人 做 参与 者 。 这 时 ， 
我 们 该 不 该 招募 那些 由 于 另外 一 种 情况 (比如 怀孕 ) 导致 出 现 胃 灼热 症状 
的 参与 考 呢 ? 我 们 是 应 该 招募 所 有 年 龄 段 的 参与 者 , 还 是 应 该 只 招募 成 年 
参与 者 呢 ? 也 许 我 们 认为 孩子 们 患 胃 灼热 的 生理 过 程 与 成 年 人 有 着 本 质 
的 差别 ,因此 决定 只 研究 21 岁 到 65 岁 有 过 胃 灼 热 病史 的 参与 者 。 然后 又 
有 了 新 的 问题 , 这 些 成 年 参与 者 中 可 能 有 人 已 经 在 服药 治疗 胃 灼 热 了 , 也 
可 能 他 们 身上 还 有 其 他 可 能 会 影响 药 效 的 因素 。 理想 情 况 下 , 我 们 研究 的 
参与 者 群体 应 该 没有 人 吃 过 任何 可 能 会 和 测试 药物 相互 作用 的 药物 。 因 
此 , 我 们 可 能 会 决定 在 21 岁 到 65 岁 、 有 胃 灼 热 病史 且 尚 未 每 天 服用 治疗 
胃 灼 热 的 药物 的 参与 者 身上 测试 这 种 药物 。 

在 选择 研究 对 象 的 过 程 中 ， 选 择 偏差 可 能 会 完全 决定 研究 的 结果 。 这 
种 选择 偏差 可 以 是 个 体 自主 决定 是 否 成 为 参与 者 导致 的 , 也 可 以 是 其 他 因 
素 让 他 们 成 为 了 或 者 未 成 为 参与 者 导致 的 。 我 们 在 第 3 章 讨 论 过 ,有 些 选 
择 偏 差 可 能 会 让 人 们 去 寻找 那些 偏向 于 特定 结论 的 证 据 , 也 可 能 会 影响 我 
们 评估 搜集 到 的 证 据 的 方式 。 我 们 的 研究 方法 可 能 也 会 导致 数据 出 现 各 种 



































































































































































































































偏差 。 比 如 说 , 通过 电话 进行 政治 民意 调查 时 ,如 果 只 调查 有 线 电话 用 户 
而 不 调查 手机 用 户 ， 可 能 就 会 牌 曲 参与 考 的 人 口 特征 。 例 如 在 2008 年 ， 
皮 尤 研究 中 心 发 现 , 在 好 几 次 只 调查 有 线 电话 用 户 的 民意 调查 中 , 奥巴马 
领先 麦 凯 恩 的 百分比 比 实际 上 低 了 2%~3%; 而 在 大 选 之 前 的 最 后 一 次 民 
意 调查 结果 中 ， 奥 巴 马 领先 麦 凯 恩 的 百分比 比 实际 上 低 了 5%. © 

随机 试验 的 目的 是 限制 选择 偏差 .但 是 在 设计 一 项 研究 时 ， 我 们 必 
须 做 出 很 多 选择 , 而 这 意味 着 出 现 选 择 偏 差 的 风险 依然 很 大 。 参加 一 个 实 
验 是 自愿 的 行为 ,所 以 选择 参加 实验 的 人 和 选择 不 参加 实验 的 人 可 能 在 本 
质 上 就 是 两 种 人 。 如 果 一 个 登记 参与 者 的 研究 人 员 知 道 了 每 一 个 参与 者 会 
被 分 到 哪 一 组 ( 如 果 分 配 规则 就 是 参与 者 的 登记 顺序 或 者 是 一 个 登记 人 员 
已 知 的 更 为 复杂 的 顺序 )， 那 这 可 能 就 会 影响 到 研究 者 会 把 参与 实验 的 机 
会 给 谁 。 这 种 偏差 会 直接 影响 我 们 能 否 通 过 研究 得 出 因果 结论 ( 内 部 有 效 
性 )， 也 会 影响 这 项 研究 在 参与 者 群体 的 典型 度 基础 上 的 适用 范围 到 底 有 
多 大 ( 外 部 有 效 性 ， 这 一 点 将 在 本 章 后 面 讨论 )。 

接 下 来 ， 我 们 看 看 如 何 处 理 那些 参与 者 没 有 完成 实验 的 情况 。 有 些 
参与 者 可 能 会 因为 与 实验 无 关 的 原因 而 中 途 退 出 实验 , 还 有 些 参与 者 可 能 
会 因为 无 法 接受 干预 措施 〈 比如 副作用 超过 了 所 有 积极 作用 的 干预 措施 ) 
而 中 途 退 出 实验 。 “在 联系 参与 者 获取 实验 结果 数据 时 ， 有 些 参 与 者 可 能 
会 联系 不 上 ( 被 称 为 “ 失 访 ”参与 者 )。 比 如 说 ， 有 一 项 研究 要 评估 中 风 
病人 出 院 后 3 到 6 个 月 的 恢复 情况 。 研 究 方案 可 能 会 要 求 研 究 人 员 给 这 
些 病人 或 给 他 们 的 看 护 人 员 打 电话 并 调查 他 们 的 恢复 情况 。 但 是 ， 有 些 
病人 可 能 从 来 都 不 接 电话 ， 还 有 些 病人 可 能 已 经 换 了 电话 号 码 或 者 已 经 
搬家 了 ， 这 就 导致 研究 人 员 无 法 联系 到 他 们 。 

有 些 研究 人 员 可 能 会 在 分 析 数 据 时 直接 忽略 那些 联系 不 上 的 病人 ， 
但 如 果 这 些 数据 的 缺失 不 是 随机 的 , 那 这 样 的 行为 可 能 会 导致 结果 出 现 偏 
差 。 而且 在 评估 一 项 研究 时 , 缺失 大 量 的 参与 者 数据 应 该 是 一 个 很 危险 的 





























































































































































































































174 ， 别 拿 相 关 当 因果 ! 





省 











果 关 系 简 易 入 门 








信和 号。 假设 我 们 要 在 老年 人 身上 测试 一 种 运动 干预 法 。 与 不 进行 任何 干 
预 的 对 照 组 相 比 , 那些 每 周 运 动 10 个 小 时 的 老人 的 胆固醇 含量 更 低 ， 而 
日 寿命 也 比 其 他 老人 要 长 两 年 。 然而, 如果 在 随机 分 配 去 参加 这 项 实验 的 
老人 中 , 有 75% 的 老人 由 于 受伤 或 极度 疲劳 而 中 途 退 出 了 实验 , 那么 这 项 
研究 很 可 能 会 得 出 这 样 一 个 结论 : 那些 健康 到 每 天 可 以 运动 一 小 时 以 上 的 
老人 比 那 些 无 法 完成 每 天 一 小 时 以 上 运动 量 的 老人 活 得 更 久 一 些 。 在 这 个 
案例 中 , 老人 是 否 一 直 留 在 这 个 实验 中 是 评估 干预 措施 的 可 接受 性 的 关键 
因素 。 因此, 直接 名 略 那些 数据 不 完整 的 参与 者 会 导致 我 们 高 估 治 疗 方案 
的 有 效 性 并 低估 它 可 能 会 产生 的 副作用 。 

幸存 者 偏差 可 以 被 归 为 一 种 选择 偏差 ， 是 由 于 我 们 在 分 析 数 据 时 只 
分 析 那 些 一 直到 某 个 时 间 点 还 幸存 的 或 者 还 留 在 实验 中 的 参与 者 。 但 更 宽 
泛 地 讲 , 幸存 者 偏差 是 我 们 在 分 析 研究 结果 时 ,只 分 析 那 些 成 功 到 达 某 个 
终点 的 参与 者 群 体 或 案例 群体 的 数据 导致 的 。 这 个 群体 可 能 是 那些 至 少 有 
两 年 损益 表 的 公司 ( 忽略 所 有 没 到 两 年 就 破产 的 公司 )， 也 可 能 是 那些 已 
经 完成 第 一 任期 的 政客 ( 忽略 那些 未 完成 第 一 任期 就 已 经 死亡 的 、 秤 职 的 
或 被 提前 赶 下 台 的 政客 ), 还 可 能 是 那些 已 经 发 行 过 热门 单 曲 的 音乐 人 ( 忽 
略 那些 从 没 拿 到 过 音乐 发 行 合同 的 音乐 人 )。 如 果 我 们 要 研究 的 是 频繁 的 
巡回 演出 会 给 那些 非常 成 功 的 音乐 人 春来 什么 影响 ,那么 那些 已 经 发 行 
过 热门 单 曲 的 音乐 人 可 能 就 是 我 们 要 研究 的 对 象 ; 相反 , 如 果 我 们 要 研究 
的 是 早期 艺术 教育 对 音乐 上 的 成 就 会 有 什么 影响 ,那么 只 研究 这 些 在 音乐 
上 有 很 高 成 就 的 人 就 会 让 我 们 得 出 一 个 有 偏差 的 结论 。 
在 某 些 情况 下 ， 无 论 是 出 于 道德 考量 还 是 成 本 因素 ， 我 们 根本 无 法 
对 参与 者 和 各 种 情形 进行 随机 处 理 , 这 时 就 需要 利用 其 他 类 型 的 研究 。 一 
种 是 队列 研究 ， 比 如 护士 健康 研究 。 在 队列 研究 中 , 我们 会 对 一 个 群体 进 
行 一 个 前 脆性 的 、 持 续 一 段 时 间 的 跟踪 研究。 这 种 研究 的 缺陷 ( 除了 选择 
RÆ ) 在 于 , 我 们 可 以 从 每 个 人 身上 搜集 同样 的 数据 , 但 要 想 长 时 间 跟 






















































































































































































































































































踪 研 究 ， 那 么 研究 成 本 会 很 高 ， 而 且 中 途 退 出 的 人 数 可 能 会 很 多 。 此 外 ， 
倘若 我 们 研究 的 结果 出 现 的 概率 很 小 , 那 就 需要 一 个 很 大 的 样本 来 进行 研 
FE, 但 这 也 无 法 保证 我 们 能 够 观察 到 足够 多 的 我 们 想 要 观察 的 事件 。 还 有 
一 种 是 病例 对 照 研究 , 这 种 研究 一 般 是 回顾 性 研究 。 我 们 选择 在 某 些 特征 
上 不 同 的 (比如 红头 发 的 人 和 非 红头 发 的 人 ) 两 组 参与 者 , 然后 回顾 他 们 
之 间 的 差别 是 什么 ( 比如 遗传 变异 ) 然而， 由 于 我 们 只 是 在 观察 这 些 差 
异 而 不 是 积极 地 干预 它们 ， 所 以 无 法 保证 已 经 测量 了 所 有 的 干扰 因子 。 

















7.2.2 如何 设 置 对 照 组 


1946 年 , Bradford Hill 和 英国 医学 研究 理事 会 的 其 他 研究 人 员 一 起 对 
比 了 卧床 休息 和 服用 抗生素 链 霉 素 对 治疗 肺结核 的 效果 。 这 是 医学 研究 史 
上 具有 里 程 碑 意义 的 一 件 大 事 , 而 且 可 能 也 是 医学 研究 中 第 一 次 使 用 随机 
对 照 试验 。" 参 与 这 次 试验 的 每 一 家 医院 都 收 到 了 一 组 标 了 号 的 密封 信 据 ， 
每 一 封 信 中 都 装 了 一 份 治疗 方案 (休息 或 链 霉 素 )。 由 于 医院 里 的 每 一 个 
肺结核 病人 都 登记 参加 了 这 次 试验 ， 所 以 与 每 一 个 病人 的 登记 号 码 的 下 
一 个 号 码 相 对 应 的 信封 就 是 这 个 病人 的 治疗 方案 。” 

与 Lind 的 试验 一 样 , 研究 人 员 并 不 只 是 考察 服用 链 考 素 前 后 的 效果 ， 
而 是 将 链 霉 素 的 效果 和 当时 标准 的 治疗 方案 ( 即 卧 床 休息 ) 进行 了 对 比 。 
这 一 点 很 重要 , 因为 只 对 比 病人 在 接受 治疗 前 后 的 病情 的 话 , 即使 治疗 方 
案 没有 任何 效果 , 如 果 病 情 本 身 随 着 时 间 的 变化 逐渐 好 转 了 , 那么 对 比 结 
果 也 会 显示 病情 有 所 好 转 ; 而 且 在 某 些 情况 下 , 治疗 行为 本 身 ( 即便 这 个 
药物 没有 效果 ) 可 能 也 会 给 病人 的 病情 带 来 积极 的 影响 。 

比如 说 ， 有 些 病人 深信 某 种 抗生素 可 以 治疗 他 们 身上 的 流感 病毒 ， 
有 时 他 们 会 一 直 要 求 医 生 给 他 们 开 这 种 药 , 直到 医生 同意 为 止 。 如 果 最 后 
他 们 的 感冒 跟 大 部 分 人 一 样 都 好 了 , 那 他 们 的 康复 和 这 个 药 也 没有 任何 关 
系 ,这 只 不 过 是 感冒 过 程 的 必然 结果 。 如 果 他 们 在 生病 时 没有 服用 抗生素 ， 
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而 是 喝 了 标 咖 啡 、 看 了 很 久 的 电视 , 或 者 做 了 任何 其 他 的 事情 , 那么 这 些 








行为 似乎 对 治疗 感冒 也 有 同样 的 效果 。 











进行 对 照 试验 的 男 一 个 原因 是 ,我 们 在 实际 生活 中 并 不 是 在 新 的 治 




















疗 方案 和 没有 治疗 方案 之 间 进 行 选择 , 而 是 想 知 道 一 组 治疗 方案 中 的 哪 
个 效果 最 好 。 在 选择 合适 的 对 照 组 时 , 由 于 我 们 不 应 该 妨碍 病人 接受 有 效 





























的 治疗 , 所 以 不 仅 需要 考虑 道德 问题 和 逻辑 问题 ,还 必须 解释 ; 
身 对 结果 的 影响 。 











台 疗 行为 本 


在 某 些 情况 下 ， 我 们 可 以 将 标准 治疗 方案 的 治疗 效果 和 新 方案 的 治 
疗效 果 进 行 对 比 ; 男 外 一 些 情况 下 , 我 们 可 能 需要 安奈 剂 。 这 可 能 是 因为 
没有 标准 治疗 方法 可 以 参照 , 也 可 能 是 由 于 研究 方法 中 存在 偏差 。 即便 是 





















































使 用 一 种 比 当 前 使 用 的 治疗 方法 糟糕 得 多 的 治疗 方法 , 可 能 也 比 不 接受 任 


何 治疗 的 效果 要 好 。 选 择 一 种 合适 的 安慰 剂 很 难 , 但 从 根本 上 来 说 , 安奈 
剂 是 一 个 能 够 尽 可 能 模仿 真实 干预 措施 而 又 不 具备 真实 干预 措施 的 主要 



































有 效 特征 的 事物 。 最 简单 的 例子 就 是 , 如 果 某 种 药物 是 以 药丸 的 形式 服用 




















的 , 那 人 们 通常 会 用 一 个 跟 这 个 药丸 一 样 的 糖 丸 来 作为 安奈 剂 。 如 果 干 预 
措施 是 有 关 改 善 健 康 的 短信 , 那 人 们 可 能 会 用 与 健康 无 关 的 短信 来 作为 安 
感 剂 。 不 过 ,要 想 找 到 一 个 用 来 代替 针灸 的 安奈 剂 就 难得 多 了 。 在 最 极端 
的 情况 下 ,人 们 甚至 曾经 在 帕 金 森 和 其 他 疾病 的 治疗 试验 中 , 使 用 虚假 的 









































手术 来 解释 手术 行为 本 身 对 病人 的 影响 。™ 











一 种 治疗 方法 虽然 没有 任何 已 知 的 有 效 成 分 , 却 仍然 能 够 改善 病人 























的 病情 ， 这 就 是 安奈 剂 效应 。 它 能 导致 一 些 很 奇怪 的 结果 ，” 甚至 在 病 














人 已 经 知道 他 们 吃 的 是 安 感 剂 时， 仍然 可 能 会 出 现 安 感 剂 效应 。” 有 报 
告 指出 ， 有 些 病 人 在 服用 安奈 剂 时 出 现 了 副作用 。” 而 且 在 安慰 剂 对 比 























研究 中 ， 人 们 还 发 现 由 于 药丸 的 剂量 〈 似乎 药 九 数量 越 多 效 
和 外 观 不 同 ， 安 感 剂 的 治疗 效果 ( 安 感 剂 效应 ) 也 不 同 。” 


就 越 好 ) 











这 让 我 们 想到 了 链 霉 素 试验 的 另 一 个 关键 特征 : 这 是 


个 双 盲 试 
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Br, 无论 是 参与 试验 的 病人 还 是 评估 治疗 效果 的 研究 人 员 ， 都 不 知道 病 
人 接受 的 是 哪 一 种 治疗 方案 。” 这 是 避免 证 实 性 偏差 的 关键 步骤 
为 那些 预计 某 种 药物 会 生效 的 病人 , 可 能 会 以 另外 一 种 方式 向 医生 描述 他 
们 所 出 现 的 症状 ; 同样， 如 果 医 生 知道 病人 接受 的 是 哪 一 种 治疗 方案 ， 
他 们 可 能 也 会 对 病人 的 病情 做 出 不 同 的 诊断 。 

有 一 项 研究 在 测试 多 发 性 硬化 症 的 多 种 治疗 方案 的 同时 ， 还 测试 了 
育 法 试验 对 试验 结果 的 影响 。 在 实验 中 , 两 组 不 同 的 神经 学 家 对 同一 群 病 
人 进行 了 评估 , 其 中 一 组 神经 学 家 对 病人 所 接受 的 治疗 方案 一 无 所 知 ,而 
男 一 组 神经 学 家 则 清楚 地 知道 每 一 个 病人 所 接受 的 治疗 方案 是 什么 ,经 过 
24 个 月 的 定期 观察 后 ， 接 受 讶 法 试验 的 神经 学 家 们 发 现 没有 一 个 治疗 方 
案 是 有 效 的 , “而 那些 没有 接受 盲 法 试验 的 神经 学 家 却 发 现 有 一 组 病人 的 
病情 有 所 改善 。 之 所 以 会 出 现 这 个 差别 , 是 因为 神经 学 家 对 病人 病情 的 评 
佑 是 定性 评 佑 , 所 以 那些 没有 接受 盲 法 试验 的 神经 学 家 可 能 因为 已 知 病 人 
接受 的 是 何 种 治疗 方案 ， 因 此 在 评估 病人 的 病情 时 受到 了 影响 。 当 一 个 
实验 的 结果 涉及 这 样 的 知识 时 ( 无 论 是 评估 对 照 试验 中 病人 的 病情 ,还 是 
评估 自家 花园 里 花 儿 的 生长 情况 )， 知 道 每 一 组 参与 者 接受 的 干预 措施 是 
什么 ， 可 能 会 改变 我 们 对 已 有 证 据 的 解释 方式 。 

一 般 来 说 ， 在 单 育 试验 中 ,病人 不 知道 他 们 接受 的 治疗 方案 是 什么 ， 
但 是 做 试验 的 那些 人 是 知道 的 。 在 双 盲 试验 中 , 无 论 是 病人 还 是 临床 医生 
都 不 知道 病人 接受 的 治疗 方案 是 什么 。 然 而 , 当 搜 集 完 试验 中 的 所 有 数据 
后 , 我 们 不 能 简单 地 将 这 些 数据 都 放 进 一 个 黑匣子 ,然后 等 它 给 我 们 输出 
一 个 确定 的 结果 。 在 数据 分 析 中 , 我 们 需要 做 很 多 决定 ( 比如 要 做 哪些 统 
计 检 验 )， 而 这 些 决定 可 能 也 会 存在 偏差 。 因此， 还 有 一 种 选择 就 是 做 三 
盲 试验。 三 育 试 验 首先 是 双 盲 试验 , 同时 , 那些 负责 分 析 数 据 的 研究 人 员 
出 不 知道 每 一 组 参与 者 接受 了 什么 干预 措施 。” 

这 种 三 盲 试验 也 许 并 不 总 是 行 得 通 ， 但 我 们 可 以 在 看 到 任何 搜集 到 
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的 数据 之 前 ,预先 确定 分 析 数 据 时 将 会 采取 的 所 有 步 又, 并 把 这 些 步骤 记 























录 下 来 , 以 表明 数据 分 析 方 案 是 在 没有 受到 结果 影响 的 情况 下 独立 设计 出 
来 的 “实验 和 药品 试验 登记 正 是 这 样 做 的 ， 这 要 求 研究 人 员 在 搜集 到 任 
何 数据 之 前 就 确定 数据 分 析 方案 。” 由 于 经 常会 有 意 想不到 的 情况 出 现 
(虽然 这 会 导致 人 们 倾向 于 发 表 积极 成 果 的 偏差 很 明显 ”), 所 以 这 种 方法 












































在 实际 中 也 会 遇 到 一 些 问题 。 在 我 们 假设 的 胃 灼 热 研究 
定 要 测量 的 主要 指标 ( 比如 胃 灼 热 出 现 的 次 数 ) 和 次 要 指标 CHEM B K 
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我 们 可 以 提前 





热 的 严重 程度 ) 是 什么 , 并 且 提 前 确定 如 何 进 行 盲 法 试验 以 及 大 约会 有 多 




















少 参 与 者 参加 这 个 试验 。 然 而 ,我 们 招募 到 的 参与 者 数量 可 能 达 不 到 目标 ， 
也 有 可 能 我 们 没有 预计 到 会 资金 缺乏 而 不 得 不 提前 结束 试验 。 所 以 , 严格 

















按照 预先 制订 好 的 方案 执行 也 许 并 不 总 是 行 得 通 。 








7.2.3 ”研究 结果 适用 于 哪些 人 





假设 我 们 确实 进行 了 胃 灼 热 研究 ， 而 且 研 究 似乎 很 成 功 。 与 另外 一 
种 治疗 方案 相 比 , 这 种 药物 大 大 降低 了 胃 灼 热 的 严重 程度 并 减少 了 病人 的 











发 病 次 数 。 于 是 ， 这 种 药物 最 终 获 得 了 生产 许可 并 天 














F 始 投放 市 场 。 一 位 医 


生 曾 经 看 过 这 个 试验 的 结果 ， 他 现在 在 诊断 一 个 80 岁 的 病人 ， 这 个 病人 

















每 天 服用 10 种 药物 ，” 而 且 不 仅 患 有 糖尿 病 ， 还 有 充血 性 心力 衰竭 病史 。 














这 位 医生 该 不 该 给 这 位 病人 开 这 种 新 药 呢 ? 



























































通过 控制 试验 来 保证 内 部 有 效 性 (这 意味 着 它 能 够 回答 我 们 提 的 问 





题 ) 常常 会 牺牲 外 部 有 效 性 〈 试验 结果 具有 更 广泛 的 普遍 性 )。 研 究 一 个 
同 质 群体 可 以 将 可 能 的 原因 分 离 出 来 , 但 当 我 们 在 做 关于 其 他 群体 的 决定 




















时 ,这 反 过 来 又 会 限制 这 种 研究 结果 的 适用 范 上 
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i, 研究 群体 中 





更 多 的 变化 可 能 会 引起 混乱 , 并 导致 我 们 无 法 找到 变量 的 真正 影响 ( 如 果 
这 种 影响 只 在 特定 子 群 中 出 现 的 话 )。 因 此 ， 我 们 必须 认识 到 ， 随 机 对 照 


试验 的 每 一 个 阶段 都 有 一 个 选择 的 过 程 。 











在 一 个 典型 的 临床 试验 中 ， 
床 试验 的 机 构 接受 治疗 的 患者 ， 





























我 们 所 用 的 潜在 患者 库 是 那些 在 进行 临 
或 者 是 那些 机 构 能 接触 到 的 患者 。 但 是 ， 














这 个 患者 库 已 经 将 所 有 无 法 获得 或 者 没有 寻求 医疗 服务 的 患者 排除 在 外 
To 我 们 需要 想 一 想 , 临床 试验 机 构 和 参与 试验 的 临床 医生 治疗 的 都 是 什 
么 样 的 病人 。 这 些 病 人 可 能 会 比 整个 病人 群体 的 平均 病情 更 加 严重 , 或 者 
正好 相反 , 这 些 病 人 中 可 能 并 不 包括 那些 病情 最 严重 的 病人 , 因为 他 们 已 

















经 被 介绍 到 其 他 地 方 接受 治疗 了 








我们 还 需要 考虑 这 些 试验 所 设 定 的 病人 


的 资格 标准 , 这 些 标 准 常常 将 那些 同时 患 有 多 种 慢性 疾病 的 病人 排除 在 外 
( 正如 我 们 在 假想 的 胃 灼 热 试 验 中 的 做 法 ) 等 到 病人 真正 同意 参与 这 个 试 
验 时 , 试验 针对 的 患者 群体 已 经 被 筛 减 掉 很 多 人 了 。 这 个 试验 其 实 并 不 一 
定 要 包含 所 有 的 患者 , 重点 是 试验 中 存在 很 多 实际 考量 的 因素 ,它们 会 影 




















响 最 终 哪 些 人 会 被 招募 进来 。 当 不 再 考察 试验 的 有 效 性 而 是 开始 试图 应 用 








试验 结果 时 ， 我 们 需要 考虑 到 这 




















如 何 确定 试验 结果 是 否 适 














j 于 某 个 病人 或 病人 群体 7” 人 们 已 经 对 这 








个 问题 进行 了 很 多 讨论 。” 我们 通常 并 不 是 在 RCT 的 理想 化 世界 中 做 决 








策 ， 比 如 病人 通常 只 患 一 种 疾病 
了 正好 相关 的 研究 之 后 再 做 决策 








o 在 大 多 数 情 况 下 ,我 们 也 不 可 能 等 到 有 
.临床 医师 在 为 病人 确定 治疗 方案 时 就 是 






































如 此 ， 我 们 在 试图 确定 研究 报告 和 自身 的 相关 性 时 也 是 如 此 。RCT 的 问 
题 在 于 , 它 只 告诉 我 们 某 种 治疗 方案 在 某 个 特定 的 人 群 中 可 能 会 导致 某 种 





























结果 。 但 是 ， 另 外 一 个 人 群 却 可 

















能 不 具备 让 这 种 治疗 方案 起 作用 的 特征 。 


比如 说 , 如 果 一 个 RCT 发 现 药品 A 比 药 品 B 更 有 效 , 而 另 一 个 RCT 


发 现 药 品 B 比 药品 C 更 有 效 ， 那 么 我 们 很 可 能 会 假设 药品 A 比 药品 C 更 
有 效 。 对 各 种 抗 精神 病 药 物 的 考察 发 现 , 情况 正 是 这 样 的 。 但 是 , 这 种 随 














机 试验 还 证 明了 药品 C 实际 上 要 比 药 品 A 更 有 效 。 为 何 会 出 现 这 种 反常 











的 发 现 呢 ? 很 多 这 样 的 研究 都 是 








1 被 测试 药品 的 制造 商 资助 的 , 但 无 论 这 











些 研究 是 由 谁 资助 的 , 这 种 不 一 致 的 结论 都 会 出 现 。 即 便 报 告 的 数据 完全 
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真实 , 并 且 在 试验 的 过 程 中 没有 任何 不 道德 的 行为 , 但 由 于 人 们 必须 在 试 
验 的 过 程 中 做 出 各 种 决定 , 所 以 实验 的 结论 仍 有 可 能 会 偏向 某 种 结果 。 通 
过 选择 特定 的 服用 剂量 、 资 格 标准 、 结 果 指 标 以 及 统计 检验 指标 ， 每 一 个 
选择 都 可 能 会 偏向 某 种 药物 , 从 而 导致 这 种 药物 的 效果 看 上 去 比 其 他 药物 
更 好 。 

我 们 将 在 第 9 章 学 到 ,要 想 真 正确 保 试验 的 结果 也 适用 于 一 个 新 的 群 
体 ， 我 们 需要 确保 让 原因 有 效 的 这 些 特征 同时 存在 于 试验 群体 和 新 群体 
中 ， 还 要 确保 新 的 群体 中 没有 任何 会 对 原因 产生 负面 干扰 的 特征 。 然 而 ， 
这 对 我 们 来 说 是 一 个 巨大 的 负担 , 因为 我 们 往往 并 不 知道 让 原因 起 作用 的 
素 是 什么 。 假设 我 们 随机 给 人 们 分 配 不 同类 型 的 办 公 椅 ,以 便 观 察 与 坐 
在 普通 办 公 椅 上 相 比 ,， 坐 在 瑞士 球 (抗力 球 ) 上 是 否 会 导致 人 们 的 体重 下 
降 。 在 实验 中 , 坐 瑞 士 球 使 人 们 在 6 个 月 内 体重 有 所 下 降 具 有 统计 学 上 的 
显著 性 。 但 是 ， 当 我 们 在 一 个 新 的 群体 中 做 试验 时 ， 坐 瑞士 球 却 没 有 对 他 
们 产生 任何 影响 。 如 果 情 况 是 这 样 的 : 第 一 组 参与 者 发 现 瑞士 球 坐 着 很 不 
和 舒服, 或 者 他 们 经 常会 从 瑞士 球 上 摔 下 来 , 所 以 他 们 每 天 上 班 的 时 候 会 站 
很 长 时 间 ， 或 者 一 直 来 回 走 动 ; 而 第 二 组 参与 者 把 瑞士 球 当 作 椅 子 一 样 ， 
坐 在 上 面 就 不 再 到 处 走动 。 在 这 种 情况 下 是 会 出 现 这 种 结果 的 。 其 实 真正 
的 干预 措施 并 不 是 瑞士 球 ,而 是 一 个 让 人 们 多 起 身 、 多 走动 的 东西 , 但 我 
们 在 这 个 研究 中 并 不 一 定 能 看 到 这 一 点 。 同样 , 一 种 干预 措施 在 受 控 环境 
下 的 使 用 方式 也 许 并 不 能 反映 它 的 真实 效果 。 有 些 药品 需要 在 每 天 的 同一 
时 间 准 时 服用 , 如 果 试 验 中 的 病人 遵从 这 一 医嘱 的 可 能 性 更 大 的 话 , 那么 
这 种 药品 在 现实 中 表现 出 的 疗效 可 能 会 比 在 试验 中 差 一 些 。 

一 项 研究 结论 的 使 用 方法 会 受到 很 多 其 他 因素 的 影响 ， 比 如 跟踪 研 
究 周 期 的 长 度 。 如 果 某 种 新 治疗 方案 的 RCT 只 持续 了 很 短 一 段 时 间 ， 那 
么 我 们 可 能 就 会 怀疑 长 期 使 用 这 种 治疗 方法 是 否 会 有 同样 的 效果 , 以 及 是 
和 否 存在 一 些 只 有 在 服用 了 很 多 年 之 后 才 会 出 现 的 副作用 。 研 究 周期 还 可 以 


















































































































































































































































决定 内 部 有 效 性 。 如 果 一 项 研究 测试 的 是 服药 提醒 短信 是 否 可 以 提高 病人 
遵从 医嘱 的 概率 , 但 这 项 研究 只 跟踪 研究 了 病人 三 天 , 它 就 不 能 有 效 地 证 
明 短 信 提 醒 一 般 可 以 在 很 长 一 段 时 间 内 提高 病人 遵从 医嘱 的 概率 , 因为 人 
们 对 新 的 干预 措施 的 热情 往往 会 随 着 时 间 的 流逝 而 减退 。 尽管 如 此 ,由 于 
成 本 的 制约 ,我们 不 得 不 在 跟踪 研究 周期 长 度 和 样本 规模 之 间 进 行 权衡 。 

人 们 设计 了 一 些 检查 清单 和 指导 原则 来 评估 RCT 的 研究 结论 ， 并 规 
定 了 在 一 项 研究 中 应 该 报告 哪些 内 容 。” 需 要 注意 的 一 点 是 : 我 们 不 仅 
考察 一 项 研究 的 内 部 有 效 性 , 还 要 考察 它 的 外 部 有 效 性 。 这 二 者 各 自 的 重 
要 性 有 多 大 , 则 取决 于 我 们 的 目的 是 什么 。 有 些 内 部 有 效 性 比较 低 的 研究 
可 能 会 通过 较 高 的 外 部 有 效 性 ( 而 且 可 能 会 与 我 们 关注 的 人 群 有 更 多 相关 
性 ) 使 其 重要 性 得 到 增强 。” 在 评估 的 过 程 中 ,我 们 主要 需要 关注 的 问题 
有 : 都 研究 了 哪些 人 ? 研究 的 病人 是 如 何 挑选 出 来 的 ? 研究 是 在 哪 做 的 ? 
跟踪 研究 的 周期 有 多 长 ?对 照 组 是 什么 ?这 项 研究 是 如 何 进行 育 法 设计 的 ? 
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7.3” 当 参与 者 只 有 你 自己 时 应 该 怎么 办 








在 很 多 情况 下， 我 们 要 做 的 并 不 是 判断 要 给 某 个 人 群 推荐 哪 一 种 药 
W, 或 者 哪 一 种 饮食 方案 最 好 ,而 是 要 做 一 些 关 于 自己 的 决定 。 哪 一 种 药 
物 能 更 有 效 地 减轻 我 的 头痛 症状 ? 长 跑 之 后 要 洗 冷 水 澡 还 是 热 水 澡 才 能 
让 我 的 体力 恢复 得 更 快 ?早上 喝 几 杯 咖啡 最 好 ? 

我 们 通常 并 不 会 系统 地 处 理 这 些 问题 。 相 反 ， 决 定 服用 哪 一 种 抗 过 
敏 药 的 过 程 更 像 是 一 个 反复 试 错 的 过 程 。 首 先 , 你 可 能 会 去 看 医生 , 然后 
医生 会 给 你 开 一 种 抗 过 敏 药 。 服 药 一 段 时 间 后 ,你 可 能 会 胃 不 舒服 ,于 是 
又 去 看 医生 。 也 许 医 生 会 调整 你 的 服药 剂量 , 但 调整 剂量 之 后 你 的 过 敏 症 
状 又 复发 了 。 于 是 , 你 再 次 去 看 医生 ,询问 医生 可 不 可 以 试 试 男 一 种 抗 过 
敏 药 。 你 可 能 会 按照 医生 嘱 咯 的 疗程 去 服用 第 二 种 抗 过 敏 药 , 也 可 能 会 因 
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为 过 敏 症 状 似乎 好 多 了 就 提前 停止 用 药 。 下 一 次 你 去 看 医生 的 时 候 , 医生 
会 问 你 第 二 种 药 的 效果 怎么 样 , 而 你 并 没有 觉得 这 个 药 有 什么 问题 , 所 以 
你 会 说 这 个 药 很 有 效 。 这 是 否 意 味 着 你 从 一 开始 就 应 该 服用 第 二 种 抗 过 敏 
药 呢 ? 

从 根本 上 来 说 ， 这 和 我 们 在 本 章 前 面 讨 论 过 的 肥料 试验 面临 同一 个 
问题 。 这 种 不 系统 的 序 贯 试验 不 仅 不 能 告诉 我 们 这 两 种 治疗 方案 哪 一 个 更 
有 效 ， 甚 至 也 不 能 告诉 我 们 哪 一 个 对 你 来 说 更 有 效 。 然 而 , 由 于 试验 中 只 
有 一 个 参与 者 ， 我 们 自然 无 法 进行 RCT 一 一 随机 让 一 个 人 接受 要 测试 的 
治疗 方法 ， 让 男 一 个 接受 与 之 进行 对 照 的 治疗 方法 。 

与 随机 挑选 病人 不 同 ， 只 有 一 个 参与 者 的 试验 ( 被 称 为 n-of-1 trial， 即 
基于 单个 患者 进行 多 重 交 叉 设计 的 随机 对 照 试验 ) 随 机 安排 治疗 方法 的 实 
施 顺序 。 ”在 这 方面 ， 前 面 介 绍 的 肥料 试验 尤其 缺乏 说 服 力 ， 因 为 我 们 只 
测试 了 一 个 序列 ( A-B )， 而 且 不 知道 在 测试 肥料 B 时 肥料 A 是 否 依然 起 
作用 , 也 不 知道 在 测试 肥料 B 时 的 环境 是 否 恰巧 对 花 儿 的 生长 更 有 利 。 每 
一 种 干预 方法 只 测试 一 次 并 不 能 得 出 非常 有 把 握 的 结论 , 所 以 一 般 情况 下 
会 重复 测试 多 次 。 但 是 , 要 确定 这 些 干 预 措施 的 实施 顺序 却 有 点 复杂 。 我 
们 似乎 只 需要 重复 测试 A-B 序列 就 能 获得 更 多 的 数据 ， 比 如 测试 
A-B-A-B。 尽 管 对 于 每 一 种 干预 措施 来 说 ， 我 们 都 有 了 双 倍 的 数据 ,但 是 
这 两 种 干预 措施 的 顺序 并 未 发 生 改 变 , B 总 是 在 A 的 后 面 。 如 果 我 们 测试 
出 的 结果 指标 随 着 时 间 而 发 生 了 缓慢 的 增长 ， 那 么 即便 干预 措施 是 一 样 
的 ，B 的 效果 似乎 也 总 比 A 要 好 ， 因 为 我 们 衡量 B 效果 的 时 间 要 比 A 稍 
微 晚 一 些 。 此 外 ,如 果 我 们 采用 的 是 育 法 试验 , 那么 这 种 简单 的 轮流 法 可 
能 会 导致 个 体能 够 猜 出 干预 措施 的 安排 顺序 。 

从 理论 上 来 说 ， 人 们 可 以 在 每 个 时 间 段 随机 选择 两 种 干预 措施 中 的 
任意 一 种 , 但 是 这 种 策略 也 存在 一 些 问题 。 因 为 这 种 做 法 无 法 保证 每 一 种 
干预 措施 被 选中 的 次 数 是 一 样 的 , 也 无 法 保证 两 种 干预 措施 的 分 布 是 均匀 
















































































































































































的 ， 所 以 有 可 能 会 出 现 一 个 全 部 由 A 组 成 的 序列 后 面 跟着 一 个 全 部 由 B 
组 成 的 序列 。 这 种 做 法 一 方面 会 导致 结果 出 现 偏差 , 另 一 方面 ,如 果 试 验 
还 没有 测试 到 B 序列 就 已 经 被 提前 终止 了 ,那么 这 会 将 这 项 研究 置 于 十 分 
HUET ATE HE. KE, 我 们 可 以 将 两 种 干预 措施 组 成 一 组 , 然后 随机 安排 每 
一 组 的 实施 顺序 。 这 样 一 来 一旦 选择 了 A 干预 措施 就 意味 着 接 下 来 要 
实施 B 干预 措施 。 但 是 ,这样 做 仍 有 可 能 会 导致 轮流 序列 , 所 以 我 们 还 可 
以 采用 另 一 种 方法 , 在 A-B 和 B-A 序列 之 间 寻 求 平 衡 ， 每 个 A-B 序列 之 
后 跟 一 个 B-A 序列 ,或 者 每 个 B-A 序列 之 后 跟 一 个 A-B 序列 。 也 就 是 说 ， 
第 一 组 要 么 选择 A-B 序列 , 要 么 选择 B-A 序列 , 然后 没有 选 上 的 那 一 组 就 
作为 下 一 组 。 于 是 ， 有 可 能 会 出 现 这 样 一 个 序列 : B-A-A-B-A-B-B-A。 回 顾 
一 下 前 面 讨论 过 的 非 稳 定性 问题 ( 见 第 4 章 )， 我 们 现在 要 做 的 就 是 削弱 
这 些 时 间 趋 势 对 结果 的 影响 ， 以 及 削弱 干预 措施 的 实施 顺序 对 结果 的 影响 。 

假设 我 们 现在 确定 了 一 个 用 来 测试 两 种 干预 措施 的 序列 ， 但 是 第 一 
种 干预 措施 的 影响 会 持续 很 久 。 那么 , 干预 措施 B 很 可 能 会 得 益 于 干预 措 
施 A 的 影响 。 在 一 个 标准 的 RCT F, 每 一 个 参与 者 只 接受 一 种 干预 措施 ， 
所 以 我 们 无 须 担心 多 种 干预 措施 带 来 的 累积 效应 , 或 者 多 种 干预 措施 之 间 
的 相互 作用 。 然而, 在 序列 试验 中 , 不 仅 实施 的 顺序 可 能 会 影响 干预 措施 
的 效果 ( 比如 在 对 两 种 界面 进行 测试 时 ， 人 们 可 能 总 是 更 喜欢 第 二 种 界 
面 )， 而 且 每 一 种 干预 措施 都 可 能 会 有 一 些 持续 很 久 的 影响 ( 比如 人们 对 
系统 越 来 越 有 经 验 ， 而 这 可 能 会 提升 干预 措施 的 效果 )。 在 试验 肥料 的 案 
例 中 , 如 果 肥 料 A 起 作用 的 速度 比较 慢 , 不 过 一 旦 生效 就 会 产生 比较 持久 
的 影响 ， 那 么 肥料 A 产生 影响 的 时 间 段 和 使 用 肥料 B 的 时 间 以 及 测量 肥 
料 B 效 果 的 时 间 就 会 有 重 释 。 解决 这 个 问题 的 办 法 之 一 就 是 , 在 使 用 了 肥 
料 A 之 后 , 过 一 段 时 间 再 开始 使 用 肥料 B。 这 就 是 清除 期 , 它 的 目的 在 于 
保证 第 二 种 干预 措施 实施 的 时 候 , 第 一 种 干预 措施 产生 的 任何 影响 都 应 该 
已 经 消失 了 。 但 一 种 药物 的 积极 效应 可 能 会 很 快 消失 , 它 的 副作用 却 会 存 
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留 很 长 时 间 。 清除 期 的 男 一 个 局 限 性 是 , 它 要 求 我 们 在 一 段 时 间 内 不 能 采 
取 任 何 干预 措施 , 但 在 一 段 时 间 内 不 采取 任何 治疗 方法 可 能 并 不 是 人 们 想 
要 的 状态 ( 比如 在 测试 止 疼 药 的 时 候 )。 要 想 确 定 一 个 合适 的 时 间 段 作为 
清除 期 ， 还 需要 我 们 对 干预 措施 的 工作 原理 有 足够 的 背景 知识 。 解 决 上 
述 问题 的 另 一 个 方法 ， 就 是 连续 实施 这 些 干预 措施 ， 但 是 忽略 每 一 种 干 
预 措施 一 开始 时 搜集 到 的 部 分 数据 。 

这 种 试验 ( 针对 一 个 参与 者 进行 的 RCT) 要 求 研 究 对 象 不 会 随 着 时 
间 的 变化 而 迅速 发 生 改 变 , 所 以 它 的 适用 范围 有 限 。 对 于 像 流感 这 样 的 急 
性 病 来 说 ,以 一 个 病人 作为 参与 者 进行 试验 没有 任何 意义 。 但 对 于 像 关节 
炎 这 样 的 慢性 病 来 说 ， 人 们 就 成 功 地 使 用 了 这 种 试验 。” 同样 ， 与 选举 这 
样 的 一 次 性 事件 〈 因为 在 选举 之 前 的 几 周 内 , 很 多 事情 都 在 不 断 变化 ) 有 
关 的 序列 试验 也 没有 任何 意义 。 这 种 试验 的 最 佳 研究 对 象 是 那些 或 多 或 少 
具有 一 定 稳定 性 的 事物 。 




































































7.4 可 再 现 性 











在 一 项 研究 中 ， 我 们 使 用 了 一 组 电子 病历 来 分 析 引 发 充血 性 心力 误 
竭 的 危险 因素 。 研 究 发 现 , 糖尿 病 是 一 个 会 引发 充血 性 心力 衰竭 的 危险 因 
Fo 但 当 我 们 使 用 男 一 群 人 的 病历 数据 来 复制 这 个 研究 时 , 却 发 现 充血 性 
心力 衰竭 和 糖尿 病 之 间 没 有 任何 联系 。 相反 , 我 们 发 现 医 生 给 病人 开 的 胰 
岛 素 倒 成 了 引发 充血 性 心力 衰竭 的 危险 因素 。“ 我 们 应 该 如 何 解释 这 两 种 
充满 分 歧 的 结论 呢 ? 

要 想 复 制 一 项 研究 ， 最 好 在 完全 一 样 的 情况 下 使 用 完全 一 样 的 研究 
方法 , 这 对 于 确保 研究 方法 的 说 服 力 以 及 研究 结果 的 可 靠 性 至 关 重要 。 (EL 
得 注意 的 是 , 复制 研究 和 再 现 研 究 是 不 同 的 , 后 者 的 目标 是 要 引入 变化 来 
测试 研究 结论 的 普遍 性 。 复 制 研究 则 包括 共享 计算 机 编码 、 原 始 数 据 以 







































































及 执行 计算 机 编码 所 需 的 所 有 步 又 。 如 果 其 他 人 能 够 从 中 得 出 完全 一 样 的 
结论 , 那么 这 个 研究 就 是 可 以 复制 的 。 在 有 些 实验 中 , 一 些 细微 的 变化 都 
可 能 导致 结果 出 现 巨大 的 差异 ， 所 以 真正 意义 上 的 可 复制 性 研究 很 难 实 
现 。 即 使 是 在 计算 机 程序 ( 似乎 每 一 次 执行 这 个 程序 的 时 候 , 它 都 应 该 有 






























































同样 的 表现 ) 这 种 案例 中 , 一 个 隐藏 的 病毒 可 能 也 会 导致 程序 出 现 无 法 预 
测 的 行为 。 











当 我 们 在 科学 研究 中 谈论 可 复制 性 时 ， 通 常 指 的 是 可 再 现 性 。 也 就 
是 说 , 我 们 想 要 知道 , 在 一 项 研究 中 发 现 的 结论 能 否 被 另 一 些 研究 人 员 在 
另 一 个 情况 稍微 有 所 变化 的 研究 中 再 次 发 现 。 ”这 能 够 更 加 有 力 地 证 明 我 
们 发 现 的 结论 并 不 是 巧合 。 假设 有 一 项 研究 发 现 , 与 得 到 胡萝卜 相 比 , 孩 
子 们 在 得 到 一 块 两 鸣 司 的 巧克力 之 后 , 心情 改善 的 程度 要 大 得 多 。 这 项 研 
究 的 主要 发 现 是 ， 和 蔬菜 相 比 ， 给 孩子 们 巧克力 会 让 他 们 更 高 兴 。 所 以 ， 
另 一 项 研究 可 能 会 通过 改 用 M&Ms 巧克力 豆 和 西 兰花 再 现 这 一 结论 ， 还 
可 能 会 改 用 好 时 之 吻 巧 克 力 和 红薯 再 现 这 一 结论 。 这 些 研究 都 没有 复 甫 
初 的 那 项 研究 , 但 是 它们 都 再 现 了 最 初 那 项 研究 所 发 现 的 结论 ( 与 蔬菜 相 
比 ， 巧 克 力 让 孩子 们 更 开心 )。 
丰 现 研究 结果 对 于 观察 性 研究 来 说 格外 重要 ( 如 果 无 法 再 现 研 究 结 
论 ， 可 能 说 明 研 究 中 还 有 未 考察 到 的 共同 原因 )， 而 再 现实 验 研究 中 发 现 
的 结论 对 于 形成 普遍 的 认 知 来 说 也 至 关 重 要 。 此 外 , 鉴于 我 们 在 实验 中 需 
要 做 很 多 决定 , 如 果 我 们 无 法 再 现 研究 结论 的 话 , 可 能 就 会 发 现 很 多 研究 
会 出 现 的 各 种 偏差 甚至 是 不 当 行 为 。 

有 些 研究 的 主要 发 现 无 法 再 现 ， 最 近 的 很 多 研究 工作 也 十 分 关注 这 
一 情况 。 医 药 公 司 的 一 些 报告 上 暗示， 从 科技 论文 中 找到 的 药物 靶 标 只 有 
20%~25% 是 可 以 再 现 的 。“ 还 有 一 项 研究 发 现 ， 在 53 项 关于 癌症 的 主要 
WF, RA 11% 的 结论 是 可 以 再 现 的 , ”而 一 些 观 察 研究 中 的 样本 再 现 
率 则 更 加 糟糕 。” 人 们 还 试图 再 现 那些 备 受 瞩目 的 心理 学 研究 结论 ( 因为 
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这 些 结论 常常 会 成 为 很 多 其 他 研究 者 的 工作 基础 )， 但 结果 却 一 言 难 尽 。” 

为 什么 在 一 项 研究 中 发 现 的 真实 的 因果 关系 在 男 一 项 研究 中 却 可 能 
发 现 不 了 ? 

这 可 能 是 虚假 数据 或 意外 失误 ( 比如 电子 表格 中 的 打印 错误 或 实验 
室 污染 ”) 之 类 的 问题 导致 的 。 除 此 以 外 ,真实 关系 的 再 现 也 并 不 像 看 起 
来 那么 简单 。 在 研究 心力 衰竭 的 案例 中 , 我 们 确实 再 现 了 研究 结论 ,但 要 
想 真 正 弄 清楚 这 个 问题 , 还 需要 掌握 很 多 关于 变量 含义 的 背景 知识 。 当 将 
糖尿 病 的 诊断 记录 以 一 种 结构 化 的 格式 和 诊断 时 间 保 存在 一 起 时 , 我 们 发 
现 了 它们 和 充血 性 心力 衰竭 之 间 的 联系 。 但 在 第 二 个 人 群 中 , 我 们 却 发 现 
胰岛 素 ( 治疗 糖尿 病 的 一 种 药物 ) 成 了 导致 充血 性 心力 衰竭 的 一 个 原因 。 
因为 药物 是 以 结构 化 形式 保存 的 为 数 不 多 的 事物 之 一 , 所 以 药物 出 现 的 时 
间或 者 存在 与 否 都 是 更 加 确定 的 信息 。 男 一 方面 , 由 于 这 种 医学 研究 使 用 
的 是 医院 的 病历 ,所 以 我 们 甚至 无 法 确定 谁 得 了 什么 病 。 此 外 , 我 们 不 一 
总 是 能 在 不 一 样 的 地 方 搜集 到 完全 一 样 的 数据 。 

假设 我 们 并 没有 再 现 研究 结论 ， 那 是 否 就 意味 着 最 初 的 研究 结论 是 
假 阳 性 结论 , 还 是 最 初 结论 的 普遍 性 只 是 比 我 们 想象 得 小 一 些 而 已 ? 也 可 
能 我 们 本 就 不 应 该 指望 在 当前 测试 的 这 个 人 群 中 再 现 这 一 结论 。 比 如 说 ， 
有 研究 发 现 人 们 在 因果 判断 中 存在 文化 差异 , 所 以 某 种 因素 在 某 个 地 方 可 
能 确实 会 影响 人 们 的 因果 判断 , 即使 这 个 结果 在 另 一 个 地 方 无 法 再 现 ( 即 
这 个 因素 在 另 一 个 地 方 不 会 影响 人 们 的 因果 判断 ), 它 在 这 个 地 方 也 是 真 
实 的 。 这 并 不 是 说 哪 一 个 研究 结论 是 错误 的 , 而 是 说 这 个 发 现 可 能 是 最 初 
研究 的 人 群 所 特有 的 , 或 者 最 初 研究 的 人 群 可 能 具有 某 个 我 们 不 一 定 知道 
的 特征 ， 而 我 们 的 发 现 正 是 这 个 特征 所 特有 的 。 在 这 个 案例 中 , 我 们 尝试 
进行 的 复制 研究 是 有 价值 的 , 它 告诉 我 们 这 一 发 现在 什么 时 候 会 出 现 , 什 
么 时 候 不 会 出 现 。 
电 可 能 会 出 现 这 样 的 情况 : 当 我 们 发 现 这 个 因果 关系 时 ， 它 确实 是 













































































定 ， 
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存在 的 , 但 是 后 来 再 对 它 进行 测试 的 时 候 , 由 于 人 们 已 经 知道 了 这 一 因果 
KA, 所 以 整个 系统 发 生 了 改变 。 比 如 在 金融 领域 ， 人 们 发 现 了 某 种 可 能 
会 影响 交易 行为 的 因果 关系 。” 这 种 因果 关系 在 研究 期 间 可 能 是 真实 的 ， 
但 它 是 不 可 复制 的 ， 因 为 这 种 因果 关系 随 着 时 间 的 变化 已 经 不 再 真实 了 ， 
或 者 是 因为 我 们 利用 这 种 因果 关系 实施 了 干预 措施 , 然后 改变 了 人 们 的 行 
为 (更 多 内 容 见 第 9 章 )。 随 着 人 们 对 广告 信息 敏感 度 的 降低 ， 以 及 竞选 
对 手 通过 投放 广告 来 进行 针锋相对 的 回应 ， 电 视 广告 对 政治 候选 人 的 积 
极 影响 和 消极 影响 可 能 也 会 减弱 ,但 如 果 某 项 研究 试图 去 推断 一 般 性 的 人 
类 行为 , 且 它 的 观点 超越 了 研究 对 象 和 研究 周期 的 限制 , 那 倘若 我 们 未 能 
再 现 这 项 研究 结果 ， 一 般 而 言 ， 这 个 观点 就 已 经 被 推翻 了 。 

当然 ， 在 很 多 情况 下 ， 倘 车 我 们 无 法 再 现 这 些 研究 的 结果 ， 可 能 就 
意味 着 最 初 发 现 的 那个 关系 是 假 的 。 这些 结果 也 许 是 人 们 使 用 的 研究 方法 
人 为 导致 的 , 也 可 能 是 分 析 过 程 中 的 错误 导致 的 , 还 可 能 是 研究 方式 上 的 
局 差 导 致 的。 很 多 影响 外 部 有 效 性 的 因素 同样 会 影响 可 再 现 性 。 我 们 在 第 
3 章 介绍 过 一 个 死 三 文 鱼 的 实验 ,那个 实验 得 出 错误 结论 的 原因 是 试验 的 
次 数 太 多 了 。 虽 然 我 们 通过 修正 对 比分 析 的 次 数 最 终 解决 了 这 个 问题 , 但 
如 果 我 们 发 现 的 结果 只 是 噪声 的 话 , 那么 那些 使 用 一 条 (或 两 条 ) 新 的 三 
文 鱼 进行 验证 的 试验 ， 应 该 会 在 三 文 鱼 的 大 脑 中 发 现 不 同 的 活路 区域。 

































































































































































7.5 ”机制 





如 果 有 人 告诉 你 海盗 让 地 球 的 平均 气温 下 降 了 ， 你 肯定 会 觉得 这 是 
不 可 能 的 事 。 但 是 你 的 怀疑 并 不 是 通过 实验 而 获得 的 结论 , 你 没有 在 改变 
海盗 数量 的 情况 下 观察 地 球 的 气温 有 没有 发 生变 化 , 也 没有 证 实 海盗 数量 
和 地 球 气温 这 两 个 变量 之 间 是 没有 相关 性 的 。 相反, 你 之 所 以 会 排除 这 样 
的 可 能 , 是 因为 根据 你 对 这 个 世界 运行 机 制 的 了 解 , 你 无 法 想象 出 有 哪 一 
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种 方法 能 够 通过 改变 海盗 的 数量 来 改变 地 球 的 温度 。 同 理 , 我 们 之 所 以 会 
认为 有 些 因果 关系 是 可 能 的 ， 也 正 是 基于 我 们 对 这 个 世界 运行 机 制 的 认 
知 。 由 于 我 们 已 经 掌握 了 紫外 线 照 射 和 皮肤 瘤 之 间 的 联系 , 所 以 即便 没有 
任何 观察 数据 ,我们 依然 可 以 预测 室内 晒 黑 床 和 皮肤 癌 之 间 可 能 存在 一 定 
的 联系 。 

这 是 一 种 关于 事物 运行 机 制 的 知识 ,或 者 说 是 关于 某 个 原因 如 何 导 
致 某 种 结果 的 知识 。 虽然 在 不 知道 事物 运行 机 制 的 情况 下 , 我 们 也 能 找到 
导致 某 些 结果 的 原因 ， 但 是 运行 机 制 是 能 够 证 实 这 种 因果 关系 的 一 个 证 
据 , 而且 我 们 能 够 通过 它 找到 更 好 的 干预 措施 。 原 因 会 告诉 我 们 某 些 结果 
为 什么 会 出 现 , 而 运行 机 制 会 告诉 我 们 这 些 结果 是 如 何 出 现 的 。 比 较 一 下 
“吸烟 让 手指 变 黄 ” 和 “香烟 烟雾 中 的 焦油 给 手指 上 的 皮肤 染 了 色 ” 这 两 
句 话 ,有些 研究 曾 试 图 用 事物 的 运行 机 制 来 定义 因果 关系 ,在 这 些 研 究 中 ， 
运行 机 制 大 约 相当 于 一 个 系统 , 其 各 个 组 成 部 分 相互 作用 , 通常 会 让 事物 
发 生菜 些 变化 。“ 不 过 更 重要 的 是 ， 运行 机 制 可 以 为 我 们 提供 一 些 用 来 寻 
找 因果 关系 的 线索 。 

到 目前 为 止 ， 无 论 是 使 用 经 常 出 现 的 模式 、 概 率 的 变化 ， 还 是 剂量 
反应 关系 , 我们 所 考察 的 各 种 证 明 因果 关系 的 证 据 都 与 原因 和 结果 一 起 出 
现 的 频率 有 关 。 如 果 几 经 观察 , 我 们 发 现 得 了 流感 的 人 出 现 发 热 症状 的 概 
率 更 大 ， 那 么 就 会 由 此 得 出 这 样 的 结论 : 得 流感 会 导致 发 热 症状 。 但 是 ， 
我 们 也 可 以 根据 事物 的 运行 机 制 推理 出 这 样 的 结论 : 身体 中 出 现 的 感染 病 
毒 会 给 ( 控制 体温 的 ) 大 脑 发 送信 号 ,然后 大 脑 会 将 体温 上 升 ， 以 此 来 抑 
制 感染 症状 ,一 部 分 信息 告诉 我 们 这 个 原因 是 如 何 导致 某 种 结果 可 能 出 现 
的 ， 另 一 部 分 信息 则 告诉 我 们 这 种 结果 实际 上 是 会 出 现 的 。” 

不 过 ， 正 是 由 于 对 事物 运行 机 制 的 认识 ， 只 用 两 个 基因 变 体 来 解释 
选民 投票 率 这 种 复杂 的 现象 是 不 合理 的 。 如 果 这 些 基因 同时 还 与 很 多 疾病 
以 及 其 他 现象 有 所 关联 ， 那 情况 就 更 是 如 此 了 。”“ 就 运行 机 制 而 言 ， 似 乎 
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不 可 能 存在 某 种 既 能 让 人 们 更 有 可 能 去 投票 , 又 能 导致 肠 易 激 综合 征 这 类 


疾病 的 机 














有 人 认为 每 





因为 我 们 很 难 想 象 有 哪 一 种 机 
或 者 两 杯 半 。 因 此 ,即使 某 项 研究 表明 
事 在 统计 学 上 具有 显著 
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分 而 已 。 
天 刚好 喝 两 杯 咖啡 对 健康 有 益 ， 这 种 说 法 似乎 
判 能 让 两 杯 咖啡 对 健康 有 益 , 而 不 是 一 杯 半 
啡 和 对 健康 有 益 这 两 件 
生 , 我 们 仍 有 可 能 认为 一 定 还 有 某 个 
Ro AU, 人们 在 看 到 剂量 反应 甚至 J 形 曲线 ( 就 像 我 们 在 第 5 








判 。 情 况 更 有 可 能 是 这 样 的 : 这 两 种 结果 都 涉及 很 多 因素 ， 而 我 
们 发 现 的 基因 也 许 只 不 过 是 事物 变化 过 程 


也 不 可 信 。 


其 他 原因 导致 











章 看 到 的 那样 ) 时 ,似乎 都 没有 如 此 意外 。 这 是 因为 很 多 生理 过 程 都 会 导 





致 这 一 结果 ， 而 只 服 
只 要 有 人 提出 了 某 种 运行 机 制 ， 有 人 











用 











MZ TA 





H, 
AR 





E 效 





的 生理 过 程 则 要 少 得 多 。 
就 可 能 去 做 一 些 揭 玫 


Ff 事物 之 间 





因果 关系 的 实验 。 比 如 说 ， 如 果 我 们 不 知道 导致 某 种 疾病 的 原因 是 什么 ， 
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是 知道 有 一 种 机 制 可 能 会 导致 这 种 疾病 , 而 














药物 ， 那 么 观察 这 种 药物 是 否 有 效 可 能 会 为 我 们 提供 
































是 还 有 一 种 针对 这 种 疾病 的 
些 关 于 原因 的 线 


索 。 关 于 运行 机 制 的 知识 还 有 助 于 我 们 设计 出 更 好 的 干预 措施 。 如 果 我 们 


只 知道 感染 





E 疾 的 蚊子 会 传播 症 疾 ， 却 不 知道 症 疾 是 如 何 通过 蚊子 传播 











的 ， 那么 防止 症 疾 的 唯一 措施 可 能 就 是 阻隔 人 与 蚊子 之 间 的 接触 。 但 是 ， 








如 果 我 们 知道 症 原 jd 


制 并 疾 的 方法 , 比如 阻止 疤 原 虫 进入 肝脏 , 以 及 阻止 并 
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R 进 入 血液 之 后 会 出 现 什么 情况 , 那 就 能 够 获得 多 种 控 
的 繁殖 , 等 等 。 


7.6 实验 法 是 否 足 以 找到 事件 发 生 的 原因 
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不 能 或 者 不 应 该 使 月 


然 实验 法 和 RCT 能 够 在 很 多 方面 给 我 们 提供 


Æ] 
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上 这 些 方法 。 我 们 不 需要 进行 RCT 就 能 通过 某 种 方式 





发 现 降落 镍 可 以 大 大 降低 跳伞 运动 
联系 最 初 也 不 是 通过 人 为 实验 发 现 
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识 中 把 握 事 件 发 生 的 原因 ,但 我 们 仍然 要 意识 到 , 在 某 些 情况 下 ,实验 可 
能 也 会 导致 我 们 得 出 错误 的 结论 。 比 如 以 下 两 种 情况 : 多 个 备 选 原因 都 能 
导致 某 种 结果 ， 或 实验 中 的 干预 措施 会 带 来 某 些 副作用 。 

如 果 我 们 想 知 道 某 个 基因 会 出 现 什么 样 的 显 性 性 状 ， 通 常会 在 测试 
中 抑制 这 个 基因 的 活跃 性 ( 基因 敲 除 实验 )， 然 后 观察 这 种 显 性 性 状 是 否 
还 存在 。 这 种 做 法 的 依据 是 , 如 果 我 们 认为 某 个 基因 是 导致 某 种 显 性 性 状 
的 基因 ， 并且 在 抑制 了 这 个 基因 的 活跃 性 之 后 ， 这 个 显 性 性 状 依然 存在 ， 
那么 这 个 基因 就 不 是 导致 这 种 显 性 性 状 的 基因 。 在 这 个 例子 中 , 我 们 假设 
导致 某 种 结果 的 原因 只 有 一 个 。 然 而 ,如果 这 个 显 性 性 状 依然 存在 , 那么 
可 能 还 有 一 个 备 选 原因 也 能 导致 这 种 性 状 的 出 现 ， 在 第 一 个 基因 被 抑制 
后 ， 这 个 备 选 原因 会 代替 第 一 个 基因 起 作用 。 很 多 生物 学 案例 都 是 如 此 。 
为 了 保证 某 个 性 状 的 稳健 性 , 可 能 会 存在 这 样 一 个 基因 , 它 既 能 导致 某 种 
性 状 的 出 现 ， 又 能 抑制 男 外 一 个 基因 ; 如 果 这 个 基因 被 抑制 了 ,另外 一 个 
基因 就 会 代替 这 个 基因 起 作用 。 

如 果 原 因 被 剔除 之 后 ， 相 应 的 结果 不 再 出 现 ， 这 也 并 不 意味 着 我 们 
已 经 找到 了 真正 的 原因 。 如 果 没 有 氧气 ， 房 子 就 不 会 失火 ， 因 为 氧气 是 房 
子 起 火 的 必要 条 件 。 但 我 们 不 会 因此 认为 氧气 本 身 会 引起 火灾 ( 它 是 不 充 
分 条 件 )， 因 为 火灾 的 发 生还 需要 很 多 其 他 条 件 〈 比如 热源 和 易 燃 物 )。 

假设 我 们 想 要 证 实 长 跑 是 否 有 助 于 减肥 。 为 了 测试 这 个 观点 ， 我 们 
将 试验 的 参与 者 随机 分 成 两 组 , 一 组 接受 马拉松 比赛 的 训练 , 另 一 组 每 周 
进行 几 次 一 两 公里 的 长 跑 。 矛盾 的 是 , 在 针对 这 个 假设 的 研究 中 , 那些 跑 
得 多 的 参与 者 的 体重 不 仅 没有 下 降 , 反而 还 增加 了 。 我 们 真正 想 要 考察 的 
是 ， 在 假设 其 他 因素 保持 不 变 的 情况 下 ， 长 跑 对 体重 有 什么 影响 。 但 是 ， 
实验 中 的 这 种 长 跑 导致 了 一 些 意 想 不 到 的 后 果 。 也许 参 与 者 在 长 跑 之 后 觉 
得 很 疲惫 ,于 是 在 不 跑步 的 时 间 里 , 他 们 坐 着 的 时 间 变 长 了 。 他 们 的 饭量 
可 能 也 增 大 了 ， 从 而 超额 补充 了 运动 消耗 掉 的 热量 。 因此, 副作用 不 仪 会 






























































































































































































































































在 我 们 试图 使 用 原因 来 设计 干预 措施 和 政策 时 带 来 困扰 ， 还 会 在 一 开始 
就 阻碍 我 们 找到 正确 的 因果 关系 。 更 麻烦 的 是 ， 因 果 之 间 存 在 两 个 本 质 
上 就 不 同 的 作用 路 径 , 而 这 两 个 路 径 可 能 会 抵消 对 方 的 效果 , 或 者 会 导致 
某 种 与 预期 的 关系 完全 相反 的 关系 。 这 正 是 我 们 在 第 5 章 讨 论 过 的 悖 论 ， 
而 且 这 种 情况 并 不 是 观察 性 研究 特有 的 现象 。 

所 以 , 虽然 实验 法 是 寻找 原因 的 一 个 好 方法 ,但 是 我 们 并 不 一 定 要 
使 用 实验 法 来 寻找 原因 ， 而 且 使 用 实验 法 也 不 一 定 能 够 找到 原因 。 
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面 的 例子 ， 参 见 Charney 和 English (2012 ); Fowler 和 Dawes 





( 2008 )。 


8 Ti 解释 


“这 件 事 引 起 了 那 件 事 ” 
这 句 话 意味 着 什么 ? 

















一 名 居住 在 堪萨斯 州 的 男子 在 经 历 了 一 系列 梦游 事件 之 后 ， 去 了 一 











家 治疗 睡眠 障碍 的 诊所 , 想 要 查 出 他 到 底 得 了 什么 病 。 一 个 多 月 
诊 为 非 快速 眼 动 睡眠 异常 症 。 这 种 睡眠 障碍 可 能 会 导致 人 们 做 出 一 些 奇 
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后 , 他 被 


怪 的 行为 ， 比 如 在 睡眠 中 到 处 走动 或 吃 东 西 等 , 但 大 脑 不 会 记 住 这 些 事情 。 



































在 他 被 确诊 两 个 月 之 后 ， 医 生 增 加 了 他 的 用 药 量 ， 而 在 增加 用 药 量 的 两 天 




















之 后 ， 他 被 捕 了 ， 并 且 被 控告 杀 死 了 自己 的 麦子 。， 
































睡眠 异常 症 患 者 意外 杀人 的 案例 十 分 罕见 ， 但 这 个 案例 会 














是 其 中 之 


一 吗 ? 有 一 些 证 据 显 示 , 这 个 案例 可 能 真 的 是 睡眠 异常 症 患 者 意外 杀人 的 
案例 。 这 名 男子 在 被 捕 之 前 拨打 了 911， 他 在 电话 里 的 表现 非常 奇怪 ， 似 
乎 对 于 已 经 发 生 的 事情 感到 十 分 困惑 。 鉴于 他 有 了 睡眠 异常 症 病史 , 所 以 一 
切 听 起 来 就 好 像 他 还 在 睡梦 中 一 样 。 然而, 进一步 调查 之 后 发 现 , 梦游 时 




































































的 暴力 行为 的 很 多 常见 特征 在 本 案 中 并 未 出 现 。 
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和 妻子 有 过 争吵 ( 梦游 


时 的 暴力 行为 通常 没有 任何 动机 )， 他 们 俩 之 间 的 距离 很 远 ( 梦游 者 通常 
必须 要 靠近 他 人 才 会 出 现 暴 力行 为 )， 而 且 他 使 用 了 多 种 武器 〈 梦游 时 的 
暴力 行为 通常 只 用 一 种 武器 )。 最 终 ， 这 个 案子 水 落石 出 ， 被 证 实 为 一 起 
































谋杀 事件 。 
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这 个 案子 的 重点 是 ， 不 能 只 因为 睡眠 异常 症 可 能 会 导致 谋杀 ， 而 这 
个 案子 里 既 有 睡眠 异常 证 也 有 谋杀 , 就 理所当然 地 认为 一 定 是 睡眠 异常 症 
导致 了 这 一 起 特定 的 杀人 事件 。 






































当 我 们 询问 某 件 事情 为 什么 会 发 生 时 ( 比如 为 什么 会 发 生 某 一 场 暴 
动 , 为 什么 两 个 人 会 发 生 车 辆 碰 擦 事故 , 以 及 为 什么 某 个 候选 人 会 启 得 选 
举 ), 我 们 想 要 的 是 一 个 事件 为 什么 会 发 生 或 者 为 什么 未 发 生 的 因果 关系 解 
释 。 除 此 之 外 , 还 有 一 些 其 他 类 型 的 因果 关系 解释 ( 比如 解释 两 个 事物 之 
间 的 联系 ) 和 非 因果 关系 解释 ( 大 部 分 都 是 数学 方面 的 例子 ”), 以 及 很 多 
科学 解释 理论 。 在 本 章 中 , 解释 行为 的 目标 就 是 要 找到 一 些 导致 特定 事件 
发 生 的 原因 ( 也 就 是 实体 原因 , 本 章 中 的 实体 原因 和 因果 关系 解释 是 可 以 
互 换 的 同一 事物 )。 大 部 分 情况 下 ， 我 们 想 要 解释 的 似乎 都 是 出 了 问题 的 
事件 , 但 我 们 也 可 以 问 一 问 人 们 为 什么 能 够 成 功 地 避免 菜场 核 灾难 , 或 者 
人 们 是 如 何 成 功 让 某 种 传染 性 疾病 停止 传播 的 。 

类 型 层面 上 的 因果 关系 让 我 们 能 够 深入 认识 事物 的 一 般 属性 ， 比 如 
阳光 照射 会 引起 皮肤 受伤 ; 而 实体 层面 的 因果 关系 则 与 具体 事件 有 关 ， 比 
如 马克 7 月 4 日 没有 涂 防 晒 霜 , 然后 在 海滩 上 待 了 一 整 天 , 结果 他 的 皮肤 
被 晒 伤 了 。 在 类 型 层面 上 , 我 们 想 要 获得 的 是 可 以 用 来 预测 未 来 事件 的 知 
识 , 或 者 是 可 以 用 来 在 普遍 意义 上 ( 比如 针对 整个 人 口 群体 的 政策 ) 改变 
事件 发 展 进程 的 知识 。 而 实体 层面 的 因果 关系 则 是 关于 某 个 具体 事件 的 因 
果 关 系 。 比 如 我 想 知道 为 什么 我 的 航班 会 晚点 ; 而 如 果 航 班 晚点 其 实 是 飞 
机 机 械 故 障 造成 的 , 那么 仅 知 道 天 气 和 空中 交通 情况 通常 是 导致 航班 晚点 
的 原因 ,对 我 来 说 其 实 并 没有 多 大 的 帮助 。 实 体 因果 关系 的 重要 性 通常 比 
它 在 这 个 案例 中 的 重要 性 要 大 得 多 , 例如 , 在 划分 法 律 责 任 的 过 程 中 , 或 
者 在 根据 各 人 贡献 大 小 而 颁奖 的 过 程 中 , 实体 因果 关系 都 起 了 非常 重要 的 
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作用 。 然 而 ， 有 时 可 能 会 出 现 一 些 一 次 性 事件 ， 这 种 事件 永远 都 不 会 发 
生 第 二 次 。 在 这 种 情况 下 , 我 们 可 能 在 事件 发 生 之 前 都 不 知道 还 存在 这 样 
的 因果 关系 。 比如 法 国 和 墨西哥 之 间 的 那 场 在 某 种 程度 上 由 甜品 引发 的 
战争 , 这 种 引发 战争 的 原因 闻所未闻 。“ 药 品 的 某 些 副作用 或 相互 作用 可 
能 从 来 没有 在 临床 试验 中 出 现 过 , 但 当 这 种 药品 被 用 在 更 大 且 更 加 多 样 化 
的 人 群 中 时 ， 可 能 就 会 出 现 这 样 一 些 副 作用 。 

然而 ， 这 种 特性 恰恰 导致 了 人 们 难以 确定 实体 ( 也 称 为 特定 或 实际 ) 
因果 关系 。 如 果 我 们 不 能 把 类 型 层面 的 原因 当 作 实体 原因 , 那么 即使 这 些 
原因 出 现 了 ， 我 们 又 如 何 才能 得 知 某 件 事情 为 什么 会 发 生 呢 ? 

本 章 要 考察 的 是 ， 在 某 个 具体 的 场合 ， 一 件 事 引 起 了 另 一 件 事 意味 
着 什么 ?这样 的 因果 关系 和 事物 之 间 的 普遍 联系 有 何 区 别 ? 在 研究 普 i 
联系 时 ， 我 们 寻找 的 是 事物 之 间 不 受 时 间 限 制 的 属性 。 很 多 方法 都 能 
帮助 我 们 理解 这 两 种 类 型 的 原因 是 如 何 组 合 在 一 起 的 。 我 们 可 以 先 找 到 
事物 的 一 般 属性 ， 然 后 将 这 些 属 性 套用 到 具体 事物 上 ; 也 可 以 先 从 具体 
案例 出 发 ， 然 后 得 出 一 般 性 的 结论 ; 还 可 以 提出 与 这 两 种 方法 完全 不 相 
关 的 研究 方法 。 每 一 种 方法 都 要 求 我 们 对 已 有 的 信息 进行 第 选 和 评估 ， 
但 我 们 的 研究 领域 一 直 在 不 断 发 展 并 试图 实现 这 种 解释 的 自动 化 。 我 们 
将 会 考察 如 何 才能 实现 这 种 自动 化 ， 并 且 探 讨 实现 过 程 中 面临 的 一 些 挑 
战 。 除 此 之 外 ， 还 将 考察 法 律 领 域 中 的 因果 关系 ,探讨 陪审 员 是 如 何 根 
据 证 据 进行 推理 的 。 法 律 案件 面临 着 很 多 和 其 他 案例 一 样 的 挑战 。 不 仅 
如 此 ,我们 在 法 律 案件 中 还 必须 做 出 裁决 。 障 审 员 们 一 方面 要 判断 证 据 
本 身 的 可 靠 性 ， 另 一 方面 还 要 把 那些 分 散 的 证 据 整合 在 一 起 ， 形 成 一 个 
合理 且 连 贯 的 案情 分 析 。 他 们 分 析 案 件 的 这 种 方法 可 以 指导 我 们 分 析 其 他 
案例 。 
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8.1 寻找 某 个 事件 发 生 的 原因 





我 们 知道 破旧 的 洗衣 机 会 让 水 龙头 漏水 ， 但 是 仅 知道 这 一 点 是 否 就 
能 解释 为 什么 上 周二 Ann 家 的 水 龙头 会 滴水 呢 ? 由 于 机 场 的 安检 队伍 太 
长 , 结果 Bernie 没有 赶 上 他 乘坐 的 航班 , 我 们 是 否 可 以 由 此 推断 出 安检 队 
伍 是 导致 旅客 误 了 航班 的 原因 呢 ? 在 第 一 个 案例 中 ,我 们 使 用 了 一 般 性 
的 、 类 型 层面 的 关系 来 解释 某 个 具体 案例 。 很 多 分 析 方 法 都 是 这 样 分 析 问 
PANY. 但 是 , 我们 也 可 以 把 很 多 具体 的 案例 聚集 在 一 起 , 然后 总 结 出 事物 
的 一 般 属 性 。’ 我 们 先 使 用 类 型 层面 的 原因 来 解释 实体 原因 ， 讨 论 一 下 这 
种 分 析 方 法 面临 的 一 些 挑战 ， 然 后 放松 类 型 原因 和 实体 原因 之 间 的 联系 ， 
最 后 ， 在 后 面 几 节 中 完全 切断 类 型 原因 和 实体 原因 之 间 的 纽带 。 


8.1.1 出现 多 重 原 因 时 


假设 我 们 想 知 道 是 什么 导致 了 某 一 场 车 祸 。 虽 然 我 们 无 法 从 一 场 车 
祸 中 找到 某 一 条 规律 ， 但 是 可 以 使 用 我 们 的 先 验 知识 来 解释 这 一 场 车 祸 。 
例如 ， 我 们 可 以 使 用 Mackie 的 INUS 条 件 〈 非 必要 充分 条 件 中 的 非 充分 
必要 部 分 , 详 见 第 5 ) 来 找到 好 几 组 导致 车 祸 的 因素 ,如果 这 几 组 因素 
中 至 少 有 一 组 因素 的 各 个 组 成 部 分 都 出 现 了 , 那么 车 祸 这 个 结果 就 一 定 会 
发 生 。 但 是 ,可 能 有 多 组 因素 都 足以 导致 车 祸 这 一 结果 , 所 以 这 几 组 因素 
中 的 每 一 组 都 不 是 必要 条 件 。 

如 果 我 们 想 证 实 路 面 结 冰 是 导致 这 起 交通 事故 的 实体 原因 ， 那 我 们 
还 要 知道 令 路 面 结 冰 导致 交通 事故 的 其 他 因素 也 存在 于 现场 , 比如 能 见 度 
Ro 在 这 个 例子 中 ,路 面 结 冰 本 身 并 不 足以 导致 交通 事故 。 但 是 , 如 果 路 
面 结 冰 和 人 能见度 低 这 两 个 因素 都 出 现 了 ， 驾 驶 员 又 醉酒 ， 而 且 交 通 也 非 
常 拥挤 , 情况 又 会 怎样 呢 ? 根据 图 5-2 所 示 , 这 些 组 合 足以 引起 交通 事故 
了 。 由 于 这 个 超 定 事件 中 出 现 了 多 重 充 分 原因 ， 如 果 使 用 Mackie 的 分 





























































































































































































































198 ， 别 拿 相 关 当 因果 ! 
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果 关 系 简 易 入 门 








析 方 法 ,我 们 将 无 法 找到 事件 发 生 的 原因 。 

分 析 具 体 案例 的 男 一 种 方法 是 假设 法 。 假 如 路 面 没有 结 冰 的 话 ， 这 
起 交通 事故 还 会 发 生 吗 ? 假如 驾驶 员 没有 喝酒 的 话 , 事情 的 结果 会 有 什么 
不 同 吗 ? 在 这 种 分 析 方 法 中 , 我 们 将 原因 定义 为 某 种 能 够 改变 事件 发 展 进 
程 的 事物 一 一 如 果 这 个 原因 没有 出 现 的 话 , 事情 的 结果 将 和 我 们 知道 的 实 
际 发 生 的 结果 大 不 相同 。 

这 正 是 第 5 章 讨论 过 的 反 事 实 推理 法 .前 面 说 过 , 反 事实 依赖 性 是 指 : 
如 果 原 因 没有 发 生 的 话 , 结果 也 不 会 发 生 ; 如 有 果 原 因 发 生 了 , 结果 也 一 定 
会 发 生 。 反 事实 推理 法 主要 用 于 解释 事件 发 生 的 原因 ,其 核心 思想 
事件 的 发 展 过 程 。 

反 事 实 陈述 随处 可 见 : 如 果 我 没有 吃 这 个 药 的 话 , 我 是 不 会 康复 的 ; 
如 果 我 没有 熬夜 而 是 早点 睡觉 ， 那 我 就 不 会 头疼 了 ;如果 我 穿越 街道 的 
时 候 没 有 那么 匆忙 ， 我 就 不 会 被 绊 倒 了 。 反 事实 推理 的 过 程 和 我 们 解释 
某 件 事情 为 什么 会 发 生 ( 在 心理 学 领域 被 称 为 归 因 ) 的 过 程 很 相似 ,，” 
但 是 反 事 实 推理 并 不 能 完全 解释 归 因 过 程 。 在 有 些 情 况 下 ， 反 事实 推理 
法 认为 事件 之 间 不 存在 因果 关系 (但 是 人 们 并 不 赞同 这 样 的 结论 ); 但 
在 另 一 些 情况 下 ， 虽 然 人 们 认为 两 个 事物 之 间 不 存在 因果 依赖 性 ， 但 反 
事实 推理 法 却 发 现 它 们 之 间 存 在 反 事实 依赖 性 。 

有 一 项 研究 测试 了 这 两 种 推理 之 间 的 联系 。 在 这 项 研究 中 ， 参 与 者 
读 了 一 个 故事 ， 故 事 中 的 主人 公 被 人 下 了 慢性 毒药 ,但 在 毒药 发 作 之 前 ， 
他 在 过 马路 的 时 候 遭 遇 了 车 祸 。 故事 中 说 , 这 个 人 一 辈子 干 的 坏事 太 多 ， 
所 以 才 会 遭遇 这 些 杀 身 之 祸 。 读 完 故 事后 , 研究 人 员 让 参与 者 判断 故事 中 
的 主人 公 死 亡 的 原因 是 什么 。 这 个 故事 中 的 两 个 原因 (毒药 和 交通 事故 ) 
都 可 能 导致 死亡 ， 所 以 我 们 无 法 通过 反 事 实 依赖 性 来 判断 他 的 死亡 原因 。 
但 是 , 参与 者 并 不 认为 这 些 原 因 是 对 称 的 , 事实 上 , 他 们 认为 交通 事故 与 
主人 公 的 死亡 更 加 相关 。 然 而 , 当 研究 人 员 让 参与 者 使 用 反 事实 推理 法 或 
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归 因 法 进行 原因 分 析 时 ， 他 们 给 出 的 答案 却 截然 不 同 。 由 此 可 见 ， 这 两 
种 推理 过 程 是 不 一 样 的 。 尽 管 参与 者 并 不 认为 主人 公 犯 下 的 罪行 是 他 死 
亡 的 原因 , 但 他 们 认为 从 反 事 实 推理 的 角度 来 看 , 这 是 导致 他 死亡 的 最 
重要 的 因素 。 他 们 可 能 认为 ， 如 果 时 光 倒 流 ， 这 个 因素 可 以 改变 的 话 ， 
































事情 的 结果 会 大 不 相同 。* 

















但 是 ， 也 不 是 所 有 人 都 是 这 样 想 的 。 上 面 说 的 是 最 普遍 的 结论 ， 并 


给 出 的 答案 都 是 一 样 的 , 要 记 住 这 一 点 。 这 些 结论 是 通 





不 是 所 有 的 参与 者 
过 因果 判断 或 反 事 
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所 得 出 的 最 常见 的 结论 , 但 还 有 一 些 参与 者 得 出 











了 完全 不 同 的 结论 。 我 们 随后 将 会 讨论 陪审 员 们 在 审判 案件 的 时 候 是 如 何 
进行 推理 的 。 在 这 样 的 推理 过 程 中 , 我 们 关注 的 核心 问题 是 : 为 什么 人 们 
在 分 析 同 样 的 事实 时 会 得 出 不 同 的 因果 结论 ? 我 们 想 知道 人 们 是 如 何 思 





















































考 的 ,以 及 哲学 理论 和 人 类 判断 之 间 出 现 分 歧 的 原因 是 什么 。 但 是 , 我 们 
并 不 清楚 在 人 类 判断 出 现 分 歧 的 时 候 , 是 否 还 能 利用 哲学 方法 来 获得 同样 
的 认 知 。 第 2 章 和 第 3 章 讲 过 ,我 们 寻找 和 评估 证 据 的 方法 都 是 有 偏差 的 ， 














而 且 不 同 的 人 可 能 会 有 不 同 的 偏差 。 


在 某 些 案 例 中 ,我们 可 以 说 多 重 因 素 共 同 导致 了 某 个 结果 ,但 是 在 


男 一 些 案例 中 ,我 














门 却 不 得 不 进行 责任 划分 。 对 于 一 个 行刑 队 而 言 ， 可 能 





所 有 开 枪 的 队员 都 是 导致 犯人 死亡 的 原因 , 但 我 们 不 需要 知道 致命 的 一 枪 
究 竞 是 哪个 队员 开 的 。 但 在 法 律 案件 中 , 我 们 需要 根据 每 一 个 因素 对 原告 
造成 的 伤害 程度 来 划分 其 应 该 承担 的 责任 比例 ,假设 一 个 人 由 于 长 期 在 品 
者 很 大 的 环境 中 工作 并 且 





























声 
全 是 由 于 工作 场所 
尖 是 不 一 样 的 。 而 | 

















A, 法 








任 方 按照 责任 比例 


























L 脑 部 受 了 外 伤 , 从 而 丧失 了 听力 ,而 另 一 个 人 完 


的 噪声 而 丧失 了 听力 ,那么 这 两 种 情况 下 法 院 所 判 的 赔 








院 判 给 第 一 个 人 的 赔偿 还 需要 由 这 两 个 原因 的 责 








共同 承担 。 但 是 在 现实 生活 中 ,我 们 无 法 确切 地 知道 
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200 ， 别 拿 相关 当 
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系 简易 入 门 


( 比如 说 ) 这 个 人 丧失 的 40% 的 听力 是 工作 场所 的 噪声 导致 的 ， 另 外 60% 





是 脑 部 外 伤 导致 的 。 


有 人 建议 ， 当 我 们 无 法 确定 某 个 因素 是 否 应 该 承担 责任 时 ， 可 以 这 


样 来 划分 责 介 
定 这 个 因素 所 应 承担 的 责任 上 
风险 因素 而 言 能 
比例 。” 但是， 这 利 

个 具体 
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E 比 例 : 根据 每 个 因素 在 整个 人 群 中 导致 的 某 种 结 
因素 相对 于 所 有 潜在 的 
够 导致 某 种 结果 的 比例 来 确定 这 个 因素 所 应 承担 的 责任 
Ph 建议 假设 了 事件 发 生 的 一 般 性 概率 可 以 直接 适 月 


HF, 但 事实 上 ,我们 无 法 确定 这 利 个 人 都 是 不 














上 例 , 或 者 根据 这 个 





的 比例 来 
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比例 是 否 对 每 








同 的 。 我 们 在 使 用 一 些 方法 来 计算 
但 是 这 些 方法 要 求 我 人 
更 加 具体 地 界定 我 们 想 要 解释 的 对 象 ， 能 够 解决 表 本 

















BERAREN h 
] 对 事件 发 生 的 背景 
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比如 说 , 在 目前 所 讲 的 所 有 案例 
区 分 下 午 两 点 的 交通 





一 类 型 的 事件 ,我 们 并 没有 





























事故 














i 已 经 取得 了 一 
知识 有 着 充分 的 了 解 。 
i 上 的 超 定 案例 。 
1, 我 们 一 直 都 把 各 种 死亡 事件 
的 死亡 事件 和 晚上 


看 成 是 同 





十 点 中 毒 导致 的 死亡 事件 。 每 个 人 最 终 都 会 死 , 所 以 我 们 认为 死亡 早晚 会 


发 生 ， 但 是 有 些 事情 却 导致 它 发 
因此 ， 在 运用 反 事实 推理 法 时 ， 











看 结果 是 否 会 以 不 同 的 方式 发 4 


生 的 时 间 提 前 了 。 


不 要 只 看 结 























或 者 体内 的 毒药 没有 发 作 , 那么 他 











会 不 会 发 生 ， 而 是 要 





E o 假如 这 个 案例 中 的 受害 人 没有 遭遇 车 祝 











也 有 可 能 会 在 不 同 的 时 间 、 以 不 同 的 方 


式 死去 。" 通 过 这 种 方式 ,我 们 能 够 发 现 一 些 在 其 他 情况 下 的 表面 上 的 超 














ETP A 





E 的 原因 。 


8.1.2 解释 可 能 具有 主观 性 





如 果 我 们 想 要 知道 前 面 那 个 例子 中 的 受害 者 为 什么 会 死 ， 可 


知道 这 几 个 问题 : 为 什么 死 的 























偏 是 这 个 受害 者 而 不 是 那个 犯 

















什么 这 起 交通 事故 会 致死 ? 为 





十 么 受害 者 偏 


死 在 这 


能 会 想 


ESF? H 




















天 而 不 是 那 一 天 。 


也 就 是 说 ， 即 使 我 们 解决 了 超 定 问题 ， 还 必须 考虑 两 个 人 使 用 同一 
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推理 方法 可 能 也 会 得 出 不 同 的 因果 结论 。 我 们 选择 的 测量 对 象 和 描述 测量 
对 象 的 方式 ( 比如 体重 与 身体 质量 指数 ) 都 会 影响 到 类 型 层面 的 推理 。 同 
理 , 这 些 选 择 可 能 也 会 影响 到 实体 层面 的 解释 。 除了 这 些 针 对 变量 的 选择 
以 外 ,我 们 还 必须 确定 哪些 因素 出 现 了 、 哪 些 因 素 没有 出 现 , 这 无 疑 增 加 
了 实体 层面 推理 活动 的 复杂 性 。 

有 人 可 能 认为 酒 驾 是 个 非 真 即 假 的 变量 ， 并 且 很 多 数据 都 能 证 明 这 
个 变量 是 否 为 真 。 但 是 , 有 人 一 年 只 会 去 听 一 次 非常 喧 闵 的 演唱 会 ,而 有 
人 则 是 摇滚 乐队 的 成 员 或 者 每 周 都 会 去 听 一 次 非常 喧闹 的 演唱 会 , 那么 对 
于 这 两 种 人 而 言 , 由 于 噪声 而 丧失 听力 的 风险 是 不 一 样 的 。 同 理 ， 驾 驶 员 
醉酒 的 程度 也 是 不 一 样 的 。 这 种 程度 差异 对 于 解释 行为 和 因果 推理 的 影响 
是 有 差别 的 , 在 因果 推理 过 程 中 , 我 们 是 从 数据 中 来 界定 一 组 变量 ( 比如 
将 身高 和 体重 转换 成 身体 质量 指数 ), 然后 从 这 组 变量 中 寻找 变量 之 间 的 
关系 。 

在 实体 因果 关系 案例 中 ， 我 们 将 实际 情况 与 我 们 掌握 的 类 型 层面 的 
知识 联系 在 了 一 起 。 可 能 之 前 有 一 项 研究 发 现 运 动量 大 的 人 静态 心跳 率 比 
BUR, 但 现在 我 们 想 知 道 的 是 ，Tracy 的 静态 心跳 率 比 较 低 是 否 是 运动 
量 大 导致 的 。 如 果 幸 运 的 话 , 先前 的 研究 可 能 会 准确 地 告诉 我 们 一 个 人 必 
须 锻炼 多 少 次 、 每 次 锻炼 多 长 时 间 ( 比如 一 周 6 次 ,每 次 30 分钟 ) 才能 
降低 静态 心跳 率 。 但 除 此 之 外 , 我 们 还 需要 考虑 很 多 问题 。 只 有 锻炼 三 个 
月 以 上 的 人 身上 才 会 出 现 这 种 关系 吗 ? 所 有 的 锻炼 形式 都 一 样 吗 ?要 不 
要 单独 考虑 瑜伽 和 游泳 这 两 种 锻炼 形式 ?如 果 Tracy 只 在 天 气 暖和 的 时 候 
才 锻 炼 ,在 冬天 的 时 候 根 本 不 锻炼 ,这 会 影响 这 种 关系 吗 ? 我 们 之 所 以 要 
将 实体 层面 的 观察 和 类 型 层面 的 知识 结合 起 来 , 是 因为 在 确定 事实 真相 的 
过 程 中 ， 人 们 可 能 会 不 自觉 地 带 入 自己 的 主观 性 。” 

不 同 的 人 对 于 同一 件 事 可 能 会 提出 不 同 的 问题 ， 而 且 他 们 认为 的 重 
要 因素 可 能 也 各 不 相同 〈 可 能 是 因为 他 们 所 能 控制 的 因素 各 不 相同 )， 但 
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这 并 不 会 改变 每 一 个 因素 在 整个 事件 中 真正 起 到 的 作用 。 比 如 说 , 某 个 人 
赢得 了 诺 贝 尔 奖 是 因为 这 些 因素 的 共同 作用 : 勤奋 、 幸 运 、 早 期 在 学 校 接 
受 的 自然 科学 教育 , 可 能 还 有 前 面 提 到 过 的 巧克力 。 如 果 有 人 专门 去 研究 
诺 贝 尔 奖 和 巧克力 之 间 的 联系 , 那 这 只 会 改变 研究 者 可 能 会 问 的 问题 , 而 
不 会 改变 巧克力 对 人 们 获得 诺 贝 尔 奖 的 贡献 是 否 要 比 运气 的 贡献 更 大 这 
种 事实 。 不 过 ， 当 我 们 想 让 解释 自动 化 的 时 候 ， 就 必须 减少 主观 判断 ， 而 
且 要 找到 那些 最 重要 的 因素 。 要 想 解释 长 期 在 巨大 噪声 中 生活 对 人 们 的 影 
响 , 我们 就 要 去 了 解 某 个 人 在 噪声 中 生活 的 经 历 , 所 以 , 我 们 需要 掌握 的 
数据 可 能 有 这 些 : 这 个 人 每 周 听 演 唱 会 的 次 数 、 这 个 人 的 工作 场所 是 否 有 
噪声 ， 或 者 这 个 人 是 否 生活 在 建筑 工地 附近 。 













































































8.1.3 ”原因 出 现 的 时 间 


如 果 我 们 假设 这 场 交 通 事故 是 酒 驾 引 起 的 ， 那 么 在 事故 发 生 时 ， 轰 
驶 员 应 该 处 于 醉酒 状态 。 而 对 于 那些 潜伏 期 很 长 的 传染 病 来 说 ， 我 们 则 
会 假设 病人 一 定 是 在 过 去 某 个 时 间接 触 了 传染 病毒 。 不 过 ， 某 个 人 的 流感 
不 可 能 是 从 一 年 前 和 他 一 起 吃 过 一 次 午餐 的 流感 病人 身上 感染 的 ， 也 不 可 
能 是 从 一 分 钟 前 和 他 一 起 吃 过 午餐 的 流感 病人 身上 感染 的 。 

因此 ， 使 用 类 型 层面 的 原因 来 解释 实际 案例 时 ， 让 问题 复杂 化 的 第 
三 个 因素 就 是 时 间 。 即使 我 们 掌握 的 类 型 层面 的 信息 并 没有 告诉 我 们 某 个 
原因 需要 多 长 时 间 才能 导致 某 种 结果 , 我 们 依然 不 可 避免 地 要 考虑 到 时 间 
因素 , 因为 时 间 因素 决定 着 哪些 信息 与 实际 案例 有 关 。 如 果 我 们 对 因果 关 
系 中 的 时 间 因 素 一 无 所 知 , 就 不 得 不 做 一 些 判断 来 决定 某 件 事情 是 真 还 是 
假 。 比 如 说 ,如 果 我 们 想 知 道 某 个 人 得 流感 是 否 是 因为 他 接触 了 流感 病毒 ， 
那么 这 个 人 接触 流感 病毒 的 时 间 就 很 重要 ， 它 会 告诉 我 们 这 个 人 这 次 的 
流感 是 否 可 能 是 那 次 接触 的 流感 病毒 引起 的 。 

有 些 因果 推理 方法 会 在 原因 和 结果 之 间 留 一 个 时 间 间 隔 或 时 间 窗 , 
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让 我 们 能 够 认识 到 患 小 儿 麻 痹 症 可 能 会 导致 病人 在 康复 十 五 年 后 出 现 小 
儿 麻 疗 后 遗 综合 征 。 “知道 了 这 一 点 ， 如 果 病 人 在 刚刚 康复 了 几 个 月 之 后 
就 出 现 了 一 些小 儿 麻痹 后 遗 综合 征 的 症状 , 那么 这 些 症状 是 否 是 由 小 儿 麻 
后 遗 综合 征 引 起 的 就 毋庸 置 疑 了 。 如 果 病 人 是 在 我 们 知道 的 时 间 间 隔 之 
患 了 小 儿 有 麻痹 证 , 那么 我 们 就 可 以 用 所 了 解 的 类 型 层面 上 的 因果 关系 来 
解释 这 个 实际 案例 了 。 而 且 ， 如 果 两 个 人 使 用 的 数据 相同 , 那么 他 们 对 于 
















































































的 观点 。 

时 间 对 因果 关系 的 影响 还 不 止 于 此 。 假 设 有 一 种 药物 可 以 在 30 分 钟 
到 60 分 钟 内 减轻 头痛 症状 。Charlie 得 了 头痛 证 之 后 吃 了 这 种 药物 ， 结 果 
62 分 钟 之 后 他 的 头痛 症状 减轻 了 。 那 么 ， 这 种 药物 对 Charlie 的 头痛 证 有 
没有 帮助 呢 ? 尽管 62 分 钟 不 在 30 分 钟 到 60 分 钟 的 时 间 窗 内 ， 但 如 果 由 
于 证 状 消失 的 时 间 与 我 们 了 解 的 时 间 窗 不 完全 一 致 ， 就 说 这 个 药物 不 可 
能 是 Charlie 头痛 症状 减轻 的 原因 , 那 我 们 对 时 间 的 要 求 似乎 过 于 苛刻 了 。 
以 我 们 对 头痛 药物 的 了 解 , 加 上 我 们 服用 头痛 药物 的 经 验 , 药物 起 作用 的 
时 间 窗 不 可 能 刚好 只 有 30 分 钟 , 不 可 能 在 第 29 分 钟 的 时 候 还 没有 起 任何 
作用 ， 然 后 到 了 第 30 分 钟 就 立刻 起 作用 了 。 时 间 窗 可 能 是 某 个 原因 起 作 
的 主要 时 间 段 , 所 以 它 并 不 一 定 意味 着 某 个 结果 不 可 能 在 时 间 窗 以 外 的 
时 间 发 生 ， 只 是 说 这 个 结果 在 时 间 窗 以 外 的 时 间 发 生 的 可 能 性 很 低 而 已 。 
与 之 相反 的 情况 是 登革热 , 这 种 传染 病 可 能 会 突然 暴发 。 通过 研究 登革热 
的 历史 数据 , 我 们 可 以 得 知已 经 观察 到 的 这 种 疾病 的 最 短 和 最 长 潜伏 期 是 
多 久 。 在 这 种 情况 下 , 我 们 就 能 更 有 把 握 地 确定 某 个 人 不 可 能 是 因为 在 上 
述 潜 伏 期 以 外 的 时 间接 触 了 登革热 病毒 而 感染 了 登革热 。 

尽管 Charlie 的 案例 与 我 们 先前 了 解 的 知识 并 不 吻合 , 但 这 种 情况 与 我 
们 的 先 验 知识 非常 接近 , 所 以 我 们 很 想 让 我 们 评估 解释 的 方法 变 得 灵活 一 
些 ， 以 便 可 以 将 Charlie 服用 的 药物 认定 为 他 头痛 消失 的 原因 。 同 时 ,我 
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们 还 要 有 能 力 处 理 那些 时 间 要 求 更 为 严格 的 案例 。 因 此 ， 在 找到 那些 类 
型 层面 的 因果 关系 时 ， 要 能 够 清楚 地 表明 这 些 时 间 窗 到 底 是 某 个 结果 可 
能 会 出 现 的 唯一 时 间 段 ， 还 是 某 个 结果 最 有 可 能 出 现 的 时 间 段 。 时 间 上 
的 灵活 性 还 反映 了 这 样 一 个 事实 : 我 们 所 知道 的 时 间 段 只 是 根据 某 些 先 
前 的 数据 或 先 验 知识 而 得 出 的 结论 。 假 如 我 们 的 结论 来 自 于 一 个 小 的 数 
据 集 ， 那 么 我 们 可 能 观察 不 到 某 个 很 不 常见 的 、 极 为 短暂 的 潜伏 期 。 或 
者 数据 测量 点 之 间 的 间隔 很 大 ， 甚 至 导致 第 一 次 跟踪 研究 要 到 两 天 之 后 
才能 进行 。 在 这 种 情况 下 ,由 于 数据 粒度 问题 ,我 们 可 能 永远 也 不 会 知道 
这 个 疾病 有 没有 可 能 在 第 一 天 就 发 作 。 

此 外 ， 如 果 我 们 所 了 解 的 事件 在 实体 层面 上 发 生 的 时 间 可 能 是 错误 
的 ， 那么 严格 地 遵从 某 个 已 知 的 时 间 窗 就 没有 任何 意义 了 。 如 果 我 说 某 件 
事情 发 生 在 一 个 星期 前 ， 那 么 我 说 的 一 个 星期 前 既 可 能 是 指 6 天 前 ， 也 可 
能 是 指 7 天 前 或 者 8 天 前 。 同 理 ,“1 年 前 ”几乎 不 可 能 是 指 “ 正 好 365 
天 前 "。 所 以 ， 即 使 我 们 知道 某 件 事 会 在 一 年 内 导致 另 一 件 事 ， 严 格 遵 
循 时 间 窗 的 限制 也 会 导致 我 们 忽略 数据 内 部 的 不 确定 性 。™ 
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8.2 ”具有 不 确定 性 的 解释 


解决 上 述 问 题 的 一 个 办 法 就 是 放松 类 型 层面 的 关系 与 实体 层面 的 关 
系 之 间 的 联系 。 出 于 很 多 原因 , 我 们 观察 到 的 东西 和 我 们 已 有 的 认 知 并 不 
吻合 。 因 此 , 我 们 可 以 将 这 种 不 确定 性 融入 我 们 的 解释 过 程 当中 。 有 人 在 
服药 29 分 钟 之 后 头痛 症状 就 消失 了 ， 有 人 在 服药 290 分 钟 之 后 头痛 症状 
才 消 失 , 与 第 二 个 案例 相 比 , 第 一 个 案例 的 药物 更 有 可 能 是 头痛 症状 消失 
的 原因 。 我 们 有 时 可 能 对 实际 发 生 的 事情 不 是 很 有 把 握 , 这 时 也 可 以 利用 
这 种 不 确定 性 来 进行 更 加 准确 的 解释 。 也 许 我 们 并 不 确定 Charlie 有 没有 
服用 扑热息痛 (一 种 解 热 镇 痛 药 )， 但 我 们 看 到 有 一 盒 打 开 的 扑热息痛 放 
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在 一 杯 水 旁边 ， 于 是 就 可 以 使 用 这 些 间 接 信息 来 估算 他 服用 药物 的 概率 。 
在 此 不 详 述 这 种 方法 , 但 这 种 方法 的 基本 原理 直接 代表 了 我 们 的 先 验 知识 
中 的 不 确定 性 和 我 们 对 实体 案例 中 的 信息 的 不 确定 性 。 

Mackie 的 INUS 方法 假设 了 我 们 对 事物 的 运行 机 制 有 着 充分 的 了 解 ， 
所 以 能 够 界定 确定 性 因果 关系 复合 体 , 比如 一 组 因素 的 出 现 总 能 带 来 某 



























































人 
结果 。 但 是 , 很 多 因果 关系 的 出 现 都 是 有 一 定 概率 的 ( 这 可 能 是 事物 本 身 

















的 不 确定 性 导致 的 ， 也 可 能 是 我 们 对 世界 的 认 知 不 够 全 面 导致 的 )。 即 使 
某 个 原因 导致 某 种 结果 的 概率 很 低 , 但 它 在 实体 案例 中 仍 有 可 能 成 为 导致 
某 个 事件 发 生 的 原因 之 一 , 而 我 们 计算 出 的 概率 或 原因 强度 可 以 告诉 我 们 





这 种 情况 发 生 的 可 能 性 有 多 大 。 然后 , 我 们 可 以 利用 

















因果 解释 的 依据 。” 





这 些 夸 码 来 评估 各 种 














我 们 来 看 看 这 种 方法 是 如 何 运作 的 。 假 设 我 们 想 知道 Irene 昨 晚 为 什 





么 会 失眠 。 我 们 测量 了 各 个 原因 的 显著 性 值 ( 详 见 第 6 章 )， 然 后 发 现 喝 
4 次 司 的 浓缩 咯 啡 在 4 小 时 内 导致 失眠 的 显著 性 值 为 0.9。 如 果 我 们 了 解 到 
Irene 睡 前 3 小 时 曾 去 过 一 家 咖啡 店 ， 并 且 喝 了 4 痊 司 浓缩 咖啡 ,那么 喝 






























































浓缩 咖啡 导致 她 失眠 的 显著 性 值 就 会 是 0.9。 但 是 ， 





之 后 又 熬夜 看 了 一 会 儿 电 视 ， 实 际 上 是 在 喝 咖啡 6 小 时 之 后 才 出 现 失眠 









































如 果 她 从 咖啡 店 回来 
































的 , 那么 由 于 失眠 发 生 在 浓缩 咖啡 影响 睡眠 的 时 间 范 围 之 外 , 因此 浓缩 咖 























啡 导致 失眠 的 显著 性 值 应 该 比 0.9 要 低 一 些 。 图 8-1 展示 的 是 这 些 事件 发 
生 的 序列 以 及 这 一 因果 关系 的 已 知 时 间 窗 (灰色 部 分 )。6 小 时 位 于 灰色 
长 条 所 示 的 已 知 时 间 窗 之 外 ， 所 以 Irene 那 时 候 的 失眠 似乎 不 可 能 是 之 前 





























喝 浓缩 咖啡 导致 的 。 
浓缩 咖啡 


睡觉 





OO 


3 小 时 4 小 时 


6 小 时 


图 8-1 喝 浓 缩 咖啡 导致 4 小 时 内 失眠 
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从 直觉 上 讲 ， 








我 们 并 不 认为 人 们 在 喝 了 浓缩 咖啡 后 0 小 时 到 4 小 时 内 


失眠 的 概率 是 一 成 不 变 的 , 或 者 一 过 4 小 时 失眠 的 概率 就 会 又 降 为 0。 相反 ， 


实际 情况 可 能 更 像 
致 失眠 的 概率 就 会 





图 8-2 所 示 的 那样 ， 在 过 了 第 4 个 小 时 后 ,浓缩 咖啡 导 
慢 慢 降低 。 当 我 们 对 同一 个 原因 在 不 同 的 时 间 段 对 于 结 





























果 的 显著 性 值 进 行 
应 该 将 这 种 概率 和 
比较 大 的 原因 即使 


























加 权时 (或 者 在 解释 茶 个 原因 对 不 同时 间 段 的 影响 时 ), 
显著 性 值 结合 在 一 起 考虑 。 这 意味 着 ， 一 个 对 结果 影响 
和 已 知 的 时 间 段 不 太 吻 合 , 它 的 显著 性 依然 比 一 个 对 结 


























果 影 响 比 较 小 但 是 实际 出 现 的 时 间 段 与 已 知 时 间 段 完全 吻合 的 原因 更 





























罪魁 祸首 。 








大 。 如 果 Irene 睡觉 时 房间 里 有 点 太 暧 和 了 ， 就 可 能 会 增加 她 睡 不 好 觉 的 
概率 。 但 是 , 我 们 可 能 依然 会 认为 4.5 小 时 前 喝 浓缩 咖啡 才 是 导致 她 失眠 的 
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4 小 时 





图 8-2 失眠 的 概率 随 着 时 间 的 变化 而 产生 的 变化 , 横 轴 表示 的 是 哆 


浓缩 咖 





啡 后 的 小 时 数 





























这 种 方法 的 基本 思路 是 ， 根 据 我 们 所 掌握 的 实体 层面 的 信息 来 对 类 











型 层面 的 显著 性 值 











进行 加 权 处 理 。 对 于 一 个 具体 案例 而 言 , 由 于 各 个 事件 
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发 生 的 时 间 不 同 或 























者 具有 不 确定 性 , 某 个 因素 的 显著 性 值 要 低 于 它 在 类 型 























层面 的 显著 性 值 。 我 们 可 以 根据 已 知 的 事物 运行 机 制 ( 比如 某 种 药物 的 作 
用 机 理 或 者 先前 的 数据 ( 只 需 计算 随 着 时 间 的 变化 某 个 结果 出 现 的 概率 ) 





来 定义 一 个 函数 ， 











让 这 个 函数 来 告诉 我 们 如 何 将 观察 到 的 数据 与 蘑 个 原因 











仍 在 起 作用 的 概率 相 匹 配 。 图 8-3 展示 的 是 这 个 函数 的 几 个 例子 。 在 图 8-3a 








中 ,概率 的 值 只 有 
示 的 这 个 时 间 段 内 

















两 种 可 能 : 0 或 1。 这 意味 着 某 个 原因 只 有 在 时 间 窗 显 
才 可 能 会 导致 某 种 结果 ; 在 时 间 窗 以 外 的 时 间 段 ,这 个 




















pa 


原因 不 会 产生 任何 显著 性 影响 。 相 反 ,， 在 
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8-3c 中 ， 在 时 间 窗 以 外 的 时 











间 段 内 , 某 个 原因 导致 某 种 结果 的 概率 下 降 的 速度 要 慢 得 多 。 这 种 方法 不 





























Jail 











再 主观 地 判断 某 个 具体 案例 是 否 符合 我 们 对 类 型 层 二 





i 的 认 知 , 而 是 将 类 型 











i 的 因果 关系 和 实体 层面 的 因果 关系 更 有 条 理 地 结合 


在 了 一 起 。 











(a) 
各 种 可 能 出 现 的 


(b) 








对 观察 到 的 时 间 段 和 


(c) 
知 的 时 间 段 进行 加 


已 
Lo 

















权 的 函数 。 实 线 表 示 某 个 原因 最 有 可 





Be, 虚线 表示 在 已 知 时 间 段 前 后 ， 革 个 原 


概率 是 如 何 变化 的 




















能 导致 某 个 结果 的 时 间 
因 导 致 菜 种 结果 的 


AIN 








如 果 我 们 并 不 确定 rene 有 没有 喝 浓缩 咖啡 , 又 会 怎么 样 ? 我 们 可 能 得 











知 的 信息 有 : 她 在 咖啡 
时 却 只 喝 不 含 
我 们 可 以 使 























见 了 一 个 朋友 , 她 通常 会 喝 很 多 浓缩 咖啡 ， 但 有 
如 啡 因 的 茶 。 在 没有 直接 知道 某 个 原因 是 否 出 现 的 情况 下 ， 
用 其 他 信息 来 计算 这 个 原因 出 现 的 概率 ， 然 后 再 次 对 类 型 层面 


的 信息 进行 加 权 处 理 。 所 以 ， 如 果 我 们 可 以 肯定 某 个 原因 已 经 发 生 了 , 那 














么 这 个 原因 在 实体 层面 的 显著 性 值 就 等 于 它 在 








类 型 层面 的 显著 性 值 ， 相 























反 , 如 果 根 据 我 们 掌握 的 观察 数据 , 某 个 实体 层面 的 原因 发 生 的 可 能 性 不 











大 ， 那 么 这 个 原因 的 显著 性 值 也 会 相应 降低 。 











在 这 种 情况 下， 我们 看 到 的 是 一 组 原因 和 一 系列 事件 ， 并 且 要 将 这 








两 方面 的 信息 结合 起 来 ， 从 而 确定 各 种 假设 的 

















显著 性 值 。” 我 们 由 此 得 出 




















的 结论 不 再 类 似 于 “这 个 原因 导致 了 (或 没有 导致 ) 那个 结果 ”这 种 二 元 
性 结论 ， 而 是 对 各 种 可 能 的 原因 进行 的 排序 ， 如 图 8-4 所 示 。 一 个 结果 会 





有 很 多 可 能 的 因果 解释 , 我 们 在 测 


量 每 一 个 解释 的 显著 性 值 








时 , 都 会 将 类 

















型 层面 上 的 因果 


AS 














显著 性 值 、 时 间 段 的 吻合 程度 以 及 每 一 个 原因 在 各 个 时 间 











段 发 生 的 概率 结合 在 一 起 考虑 。 与 其 他 方法 不 同 的 是 , 这 种 方法 不 需要 完 
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全 了 解 哪些 变量 是 真 的 、 哪 些 变量 是 假 的 , 而 且 实体 层面 的 时 间 段 也 无 须 
与 类 型 层面 的 时 间 段 完全 一 致 , 这 让 我 们 能 够 更 好 地 处 理 像 因 果 关 系 链 和 
超 定 这 样 的 案例 。 


















































夏季 咖啡 因 
4 小 时 内 
显著 性 值 0.9 事件 : 时 间 : 原因 : 显著 性 : 
温暖 的 房间 咖啡 因 下 午 4 点 ”咖啡 因 0.75 
夏季 一 整 天 ”温暖 的 房间 0.15 
显著 性 值 02 温暖 的 房间 未 知 
失眠 晚上 10 点 


失眠 
(a) 类 型 层面 的 因果 关系 (b) 实体 层面 的 信息 (c) 显著 性 值 
图 8-4 结合 类 型 层面 的 关系 和 实体 层面 的 信息 来 解释 失眠 这 个 结 
果 ， 对 各 种 原因 进行 了 排序 








8.3 ”将 类 型 层面 和 实体 层面 分 开 来 看 


假设 我 们 找到 了 一 组 导致 篮球 进 篮 的 因素 。 某 个 周 六 下 午 ， 一 名 篮 
球 运动 员 投 球 时 , 这 些 进 篮 的 因素 都 出 现 了 , 但 在 最 后 一 分 钟 却 因为 一 场 
地 震 而 未 能 投 进 。 虽 然 所 有 导致 篮球 应 该 进 篮 的 因素 都 出 现 了 ， 但 篮球 
却 没有 进 篮 。 这 些 因素 没有 让 篮球 进 篮 ， 但 是 ， 除 了 地 震 这 个 因素 以 外 ， 
其 他 因素 也 没有 导致 篮球 不 进 篮 。 

到 目前 为 止 ， 我 们 主要 是 在 解释 实际 发 生 的 事情 为 什么 会 发 生 。 我 
们 在 第 2 章 分 析 心 理学 文献 时 曾经 讨论 过 一 件 非 常 奇 怪 的 事 : 人 们 可 能 会 
因为 一 些 没有 发 生 的 事情 而 受到 责备 。 有 人 可 能 会 犯 下 谋杀 未 遂 罪 ,即使 
某 人 考试 作弊 未 遂 也 仍然 应 该 受到 遗 责 。 但 是 ， 如 果 某 人 没有 蔡 你 浇 论 ， 
但 花 依 然 活着 ， 我 们 又 该 如 何 解释 这 种 现象 呢 ? 这 个 花 本 来 应 该 已 经 死 
T, 但 是 它 却 没有 死 。 发 生 了 花 缺 水 的 事件 , 但 是 它 却 不 是 导致 花 活 下 来 
的 原因 。 
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第 一 天 没有 给 花 浇 水 ， 花 垃 存 下 来 的 概率 降低 了 。 随 着 不 给 花 浇 水 
的 时 间 越 长 , 花 幸 存 下 来 的 一 直 直 线 降低 。 虽然 某 个 因素 的 出 现 让 一 件 事 
发 生 的 可 能 性 降低 了 , 但 是 这 件 事 还 是 发 生 了 。 那么 ， 从 直觉 上 来 讲 ， 这 
件 事 的 发 生 并 不 是 某 个 因素 导致 的 , 而 是 在 出 现 了 某 个 不 利 因素 的 情况 下 
仍然 发 生 了 。 同 理 ， 虽 然 某 个 因素 的 出 现 让 某 件 事 发 生 的 可 能 性 提高 了 ， 
但 是 这 件 事 仍 然 没 有 发 生 , 那么 , 这 件 事 之 所 以 没有 发 生 也 不 是 某 个 因素 
导致 的 ,而 是 在 出 现 了 某 个 有 利 因素 的 情况 下 仍然 没有 发 生 。 比 如 说 ,， 尽 
管 我 们 拥有 良好 的 医疗 服务 条 件 ， 但 是 某 个 病人 仍然 有 可 能 死亡 。 

改变 某 个 结果 出 现 概率 的 原因 有 很 多 ， 但 在 这 个 结果 实际 出 现 的 时 
候 ， 并 不 是 每 一 个 原因 都 对 这 个 结果 的 出 现 产 生 了 影响 。 在 某 些 情况 下 ， 
个 事件 可 能 会 提高 某 个 结果 出 现 的 概率 ， 却 不 会 导致 这 个 结果 的 出 现 。 
比如 说 ， 假 设 Adam 和 Betty 都 得 了 流感 。 他 们 俩 在 相距 一 周 的 时 间 里 分 
别 和 Claire 一 起 吃 过 午饭 。Claire 在 第 二 次 和 他 们 其 中 一 人 共 进 午餐 后 的 
第 二 天 就 得 了 流感 。Claire 和 Adam 一 起 吃 过 午饭 后 ， 她 得 流感 的 概率 增 
加 了 ， 但 随 着 潜伏 期 的 延长 ， 她 得 流感 的 概率 又 降低 了 ; 她 和 Betty 一 起 
吃 过 饭 后 ,得 流感 的 概率 又 提高 了 ,而且 一 直到 她 真 的 得 了 流感 为 止 , 她 
得 流感 的 概率 一 直 很 高 。( 如 网 8-5 所 示 ) 虽然 这 两 个 事件 都 是 类 型 层面 
的 原因 (与 流感 病人 的 接触 )， 但 这 却 不 是 一 个 超 定 的 案例 。 相 反 ， 只 
其 中 的 某 一 次 接触 是 导致 流感 的 原因 。 在 上 一 节 中 , 我 们 使 用 了 类 型 层面 
的 时 间 段 来 处 理 这 样 的 案例 , 但 这 一 节 所 用 的 方法 与 之 不 同 。 这 一 节 研 究 
的 是 实体 层面 的 概率 是 如 何 随 着 时 间 的 变化 而 变化 的 。 这 种 方法 还 能 够 处 
理 一 些 实体 层面 的 概率 不 同 于 类 型 层面 的 一 般 概率 的 案例 。 

通常 情况 下 ， 疫 苗 是 可 以 预防 死亡 的 ， 但 在 极 少 的 一 些 情况 下 ， 疫 
苗 却 是 死亡 的 原因 。 虽 然 从 来 没有 任何 植物 因为 被 效 了 咖啡 而 死 掉 ， 却 
可 能 会 有 某 种 植物 因为 被 次 了 咖啡 而 死 掉 。 即 使 受害 者 在 一 次 谋杀 事件 
幸免 于 难 , 但 我 们 仍然 可 以 对 谋杀 未 遂 的 凶手 追究 一 定 的 责任 。 到 目前 为 
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止 , 我 们 考察 的 所 有 事件 都 有 一 个 很 关键 的 局 限 性 , 就 是 我 们 一 直 在 依赖 
一 般 性 的 信息 来 解释 具体 的 案例 ， 并 且 假 设 某 种 因果 关系 在 类 型 层面 的 显 
著 性 与 实体 层面 的 显著 性 是 一 致 的 。 
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图 8-5 感染 流感 的 概率 随 着 时 间 的 变化 而 变化 。 第 一 次 与 流感 病人 
共 进 午餐 后 ， 感 染 流感 的 概率 上 升 了 ， 第 二 次 与 流感 病人 共 进 
午餐 前 ， 感 染 流感 的 概率 下 降 了 。 在 第 二 次 接触 流感 病人 后 ， 
感染 流感 的 概率 一 直上 升 到 真 的 感染 了 流感 为 止 





























哲学 家 Ellery Eells 提出 了 一 个 研究 概率 变化 的 方法 : 观察 在 某 个 原 
出 现 之 后 , 某 个 事件 发 生 的 概率 是 如 何 变化 的 , 并 且 这 个 概率 是 如 何 随 
着 时 间 的 变化 而 改变 的 。* 我 们 并 不 打算 在 此 详细 讨论 这 种 研究 方法 ， 只 
简要 介绍 一 下 其 主要 特征 : 研究 具体 案例 发 生 概率 的 方法 要 与 研究 一 般 性 
案例 的 方法 有 所 不 同 , 这 种 方法 研究 的 是 事件 实际 发 生 的 概率 是 如 何 随 着 
时 间 的 变化 而 改变 的 。 通过 研究 我 们 想 要 解释 的 具体 案例 发 生 的 概率 , 我 
们 能 够 将 一 般 会 发 生 的 事情 和 实际 发 生 的 事情 区 分 开 来 , 并 且 意 识 到 一 个 
一 般 情况 下 可 以 预防 某 种 结果 出 现 的 原因 也 可 能 会 成 为 导致 这 种 结果 出 
现 的 原因 。 

最 重要 的 是 ， 这 种 方法 能 够 修正 我 们 的 分 析 ， 让 分 析 结 果 能 够 符合 
观察 到 的 内 容 。Eells 曾 举 过 这 样 一 个 例子 : 淘气 的 松鼠 一 般 会 将 高 尔 夫 
球 踢 到 远离 球 洞 的 地 方 , 但 在 某 一 个 案例 中 , 有 一 只 松鼠 却 将 球 对 准 球 洞 
By SREB, 从 而 帮助 了 那 名 高 尔 夫 球员 。 如 果 我 们 使 用 的 方法 是 基于 类 型 
层面 的 概率 , 那么 即使 我 们 实际 上 看 到 球 的 运行 轨迹 让 球 落 入 球 洞 的 概率 
越 来 越 大 , 然后 又 看 到 这 个 轨迹 在 被 松鼠 踢 了 之 后 是 如 何 发 生变 化 的 , 我 
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们 也 无 法 修正 先前 所 了 解 的 类 型 层面 的 知识 来 将 这 种 新 的 情况 考虑 进去 。 
结果 ， 我 们 就 会 得 出 脱离 实际 的 、 与 直觉 相 矛 盾 的 结论 。 

在 一 个 事件 发 生 后 ， 另 一 个 事件 发 生 的 概率 开始 上 升 ， 并 且 一 直上 
升 到 真正 发 生 为 止 , 那么 人 们 就 会 认为 另 一 个 事件 的 发 生 是 由 第 一 个 事件 
导致 的 。 相 反 ， 如 果 一 个 事件 发 生 后 ， 另 一 个 事件 发 生 的 概率 下 降 了 ,而 
在 这 种 情况 下 另 一 个 事件 还 是 发 生 了 , 那么 人 们 就 会 认为 这 个 事件 是 在 尽 
管 有 不 利 因素 的 情况 下 仍然 发 生 了 。" 但 是 , 由 于 我 们 很 难得 知 一 些 信息 ， 
比如 某 个 高 尔 夫 球 在 其 运行 轨迹 的 每 一 个 点 上 落 入 球 洞 的 概率 , 所 以 在 实 
际 运 用 这 种 方法 时 会 遇 到 一 些 困 难 。 

















































































































8.4 使 解释 过 程 自动 化 


我 们 如 何 才能 验证 与 事实 相反 的 情况 ?如 何 才 能 得 知 某 件 事情 发 生 
的 概率 是 如 何 随 着 时 间 的 变化 而 变化 的 ?很 多 备 受 推崇 的 哲学 理论 都 有 
一 个 局 限 性 , 就 是 那些 真正 能 反映 类 型 层面 与 实体 层面 差异 的 理论 往往 要 
求 我 们 对 研究 的 情形 有 足够 的 了 解 , 而 且 这 种 要 求 有 时 是 不 切实 际 的 。 如 
果 我 们 能 知道 在 某 个 时 刻 高 尔 夫 球 落 入 球 洞 的 概率 为 0.5， 而 在 球 被 松鼠 
跑 了 之 后 ， 其 落 入 球 洞 的 概率 增加 到 了 0.7， 那 这 个 信息 对 我 们 就 很 有 帮 
助 。 但 问题 是 ， 我 们 什么 时 候 才 能 获得 这 样 的 信息 呢 ? 

如 果 我 们 能 够 为 研究 的 系统 建 一 个 模型 ， 那 就 可 以 解决 上 述 问题 了 。 
根据 一 些 简单 的 物理 学 知识 以 及 我 们 对 风 和 其 他 影响 因素 出 现 的 可 能 性 
的 一 些 假设 ,我 们 可 以 预测 高 尔 夫 球 在 被 跑 之 前 和 被 踢 之 后 的 运行 轨迹 。 
1 于 结果 通常 是 不 确定 的 ， 所 以 我 们 可 以 对 球 的 每 一 个 位 置 进 行 多 次 模 
拟 , 从 而 计算 出 球 从 那 一 点 出 发 之 后 落 入 球 洞 的 概率 。 当 球 离 球 洞 很 远 时 ， 
或 其 他 不 太 可 能 出 现 的 事件 导致 球 的 运行 轨迹 发 生变 化 的 概率 很 高 ,但 
当 球 靠近 球 洞 时 , 要 想 让 球 偏离 球 洞 ,就 必须 出 现 更 大 的 变故 才 行 。 使 用 















































































































































212 | 别 拿 相 关 当 因果 | 


省 




















果 关 系 简 易 入 门 


反 事 实 推理 法 , 我 们 可 以 模拟 其 他 可 能 出 现 的 情形 , 从 而 从 数量 上 来 测量 
各 种 情形 之 间 的 相似 程度 , 以 及 在 某 个 原因 没有 出 现 的 情况 下 , 某 个 结果 


出 现 的 概率 。 





列 数据 。 假设 我 们 想 知道 , 一 个 





























在 医学 领域 ， 一 般 情 况 下 ， 我 们 并 没有 足够 的 信息 来 如 实 模拟 各 种 


疾病 有 可 能 出 现 的 发 展 过 程 。 但 是 , 我 们 可 以 使 用 来 自 其 他 病人 的 时 间 序 


























是 否 是 因为 服用 了 抗生素 ( 也 就 是 说 , 我 们 想 要 确定 抗 4 
用 抗生素 之 前 ， 我 们 要 利用 我 们 所 了 解 的 





存活 下 来 的 事实 )。 那 么 ， 在 服 











ji 炎 的 两 周 后 存活 了 下 来 
E 素 能 否 解 释 病 人 











关于 这 个 病人 的 所 有 数据 来 搜集 与 这 个 病人 
并 计算 出 那些 病人 在 两 周 后 存活 下 来 的 概率 。 然后 ， 








有 相似 病史 的 病人 的 信息 ， 














其 与 一 开始 就 














接受 了 抗生素 治疗 的 那 组 病人 的 存活 率 相 比 较 , 就 
生 素 后 的 存活 率 发 生 了 什么 样 的 变化 。 在 前 面 的 案 








能 看 出 病人 在 服用 了 抗 
HP, 我 们 限制 了 高 尔 








夫 球 的 运行 轨迹 (一 旦 高 尔 夫 球 到 达 某 一 个 位 置 , 我 们 就 只 考虑 它 从 那个 
位 置 出 发 后 的 运行 轨迹 ); 在 这 个 案例 中 ， 随 着 时 间 的 变化 ， 我 们 将 以 同 



































样 的 方式 来 限制 用 于 对 比 的 病人 群体 。 














从 数据 中 寻找 类 型 层面 的 原因 














直 是 计算 机 科学 研究 中 的 一 个 主要 


领域 ， 但 关于 解释 过 程 自动 化 的 方法 的 研究 却 没 那么 受 关注 。” 与 自动 化 





解决 方案 相 比 ， 人 们 更 愿意 使 用 因果 推 天 











来 解释 事物 之 间 的 关系 。 之 所 以 





会 出 现 这 样 的 情况 , 有 一 部 分 原因 在 于 , 我 们 很 难 将 反 事 实 推理 这 样 的 方 





法 转换 成 计算 机 可 以 执行 的 指令 。 要 想 设 计 出 一 个 程序 , 让 
些 关 于 某 个 情形 的 信息 , 并 且 告 
需要 将 解释 原因 的 过 程 通过 编码 转换 成 一 系列 无 须 人 为 判 

















诉 我 们 导致 某 个 结果 的 原因 














它 能 够 接收 一 
是 什么 , 那 就 
断 或 主观 想法 








就 可 以 执行 的 步骤。 第 二 个 关键 问题 是 : 要 如 何 去 评 估 这 些 程序 ? 想 要 知 











道 一 个 计算 程序 是 否 有 用 ， 我 们 需要 
然而 ， 对 于 实体 因果 关系 来 说 ， 我 们 并 不 4 























和 正确 答案 做 对 比 。 
够 知道 正确 答案 是 什么 。 


如 果 有 一 种 方法 可 以 用 来 确定 不 同 的 因素 在 某 个 结果 出 现 的 过 程 中 扮演 
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了 什么 样 的 角色 〈 比如 确定 两 个 独立 的 危险 因素 在 导致 一 个 人 生病 的 过 
程 中 所 应 承担 的 责任 的 比例 )， 而 我 们 想 要 评估 这 种 方法 ， 这 时 我 们 是 没 
有 正确 答案 作为 参照 的 ， 这 一 点 特别 让 人 头疼 。 














8.5 法 律 活动 中 的 因果 关系 














本 书 开头 介绍 了 一 个 案例 ， 在 这 个 案例 1 于 人 们 误 用 了 概率 ， 
未 能 理解 因果 关系 的 本 质 ， 结 果 导 致 Sally Clark eee 但 是 ， 除 了 
虚假 的 统计 数据 以 外 ， 上 诉 法 庭 又 是 如 何 做 出 不 同 判定 的 ?” 为 何 陪审 员 
们 在 听 到 同样 的 证 据 后 ， 商 议 了 好 几 个 星期 也 无 法 达成 一 致意 见 ? 

理解 法 律 活动 中 的 因果 关系 ，” 特别 是 理解 陪审 团 是 如 何 做 出 判定 
的 , 这 有 助 于 我 们 更 好 地 评估 其 他 情境 中 的 证 据 。 在 法 律 活动 中 ， 人 们 需 
要 处 理 的 是 大 量 十 分 复杂 而 又 相互 矛盾 的 信息 、 事 件 的 整个 发 展 过 程 而 不 
只 是 一 个 原因 和 一 个 结果 , 以 及 紧密 相连 的 信息 (人 证 如 果 说 了 一 名 错误 
的 证 词 ， 有 可 能 会 降低 他 其 余 证 词 的 可 信和 度 )。 

有 些 哲学 理论 认为 某 些 案例 是 无 法 解决 的 ， 比 如 超 定 事 件 。 但 在 法 
律 活动 中 , 我 们 不 能 接受 这 种 说 法 ,因为 我 们 无 论 如 何 都 要 做 出 判定 。 如 
果 一 个 人 既 接 触 了 石棉 , 又 吸入 了 香烟 的 烟雾 , 那 就 要 确定 这 两 个 因素 
在 这 个 人 得 肺病 的 过 程 中 分 别 应 该 承担 的 责任 的 比例 。 如 果 这 个 人 将 获得 
赔偿 ， 那 我 们 必须 划分 出 这 些 过 错 方 所 应 承担 的 责任 的 比例 。 

在 医学 或 历史 学 领域 ， 专 家 们 从 多 年 的 培训 或 经 验 中 获得 了 一 些 技 
能 , 他 们 运用 这 些 技能 来 解释 病人 身上 出 现 的 不 寻常 症状 ,或 者 找 出 某 场 
政治 运动 为 什么 会 在 某 个 特定 时 间 发 生 的 原因 。 与 这 些 专家 不 同 , 陪审 
并 不 是 法 律 方面 的 专家 , 也 不 是 他 们 听 审 的 案件 细节 的 专家 。 正 是 由 于 这 

一 点 , 法 律 活动 中 的 因果 推理 才 格 外 让 人 感 兴趣 。 陪审 员 们 可 能 不 得 不 去 

评估 环境 因素 和 医学 上 的 证 据 , 以 便 确定 癌症 疫情 密集 暴发 是 否 是 一 件 不 
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寻常 的 事 。 虽 然 他 们 不 是 肿 ; 




















窗 学 家 或 遗传 学 家 ， 但 他 们 却 不 得 不 去 确定 


DNA 证 据 能 和 否 明 确 指出 导致 癌症 疫情 密集 暴发 的 嫌 颖 人。 因此， 陪审 员 


们 的 推 
于 各 种 实际 的 原因 , 





8.5.1 


理 活动 和 我 们 日 常生 活 中 的 推 





理 活 动 更 为 相似 。 在 日 常生 活 中 ， 


出 





我 们 常常 需要 解释 一 些 问 题 , 但 又 不 一 定 非 要 对 相应 
的 领域 有 十 分 深刻 的 了 解 。 


要 不 是 因为 …… 
假设 一 名 司机 未 色 
道 汽车 的 刹车 实际 上 早 就 失灵 了 , 所 以 即便 


及 时 踩 刹车 ， 





来 。 这 个 经 常 被 引用 上 
































汽车 租赁 公司 未 能 合理 保养 并 检查 汽车 的 刹车 。” 





人 们 之 所 以 经 














常 使 用 这 个 案例 ， 














关系 的 核心 方法 之 一 是 建立 在 反 事 实 推 


我 们 会 问 “ 要 不 是 某 个 人 的 行为 〈 或 不 作为 )， 这 一 结 曙 


























是 因为 在 法 律 案件 


理 的 基础 之 上 的 。 





结果 撞 上 了 男 一 辆 车 。 但 司机 不 知 
也 踩 了 和 刹车, 也 无 法 把 
的 案例 来 自 于 一 个 真实 的 法 律 














车 停 下 


案件 。 在 那个 案件 中 ， 











1 用 来 确定 因果 














在 法 律 案件 中 ， 








会 出 现 吗 ” 


， 比 如 


说 “要 不 是 电工 让 电压 激增 ,我 的 硬盘 就 不 会 受 损 ”"。 这 种 推理 也 被 称 为 


“事实 因果 关系 ”, 与 反 事 实 推理 法 完全 一 样 
异 , 没有 原因 结果 就 不 可 能 出 现 。 然而 , 反 事实 推 
这 一 失 





出 现在 “要 不 是 ” 








理 方法 中 。 








就 法 律 案例 而 言 ， 

















o 这 种 方法 假设 原因 制造 了 差 
理 法 中 的 所 有 
使 用 这 种 方法 的 主 


问题 也 会 








要 障碍 是 无 法 处 理 超 定 问题 。 如 果 那 个 电工 是 在 中 午 的 时 候 胡 乱 改 动 了 电 








E, ERER] 
涌 电 压 保护 器 可 能 


























电压 

















所 以 ， 要 是 使 用 
再 回 到 交通 














会 出 现 , 既 有 可 能 是 | 


























导致 事故 的 发 生 。 





1 于 司机 未 曾 


试图 踩 刹车 




















保护 咒 也 坏 了 , 那么 即便 电工 没有 乱 动 电压 , 我 的 浪 
会 损坏 我 的 硬盘 。 硬 盘 损坏 这 一 结果 可 能 
外 工 造成 的 ,也 有 可 能 是 浪 涌 电压 保护 器 损坏 造成 的 。 
“要 不 是 ”推理 方法 ， 这 两 者 都 过 不 了 关 。 

事故 的 案件 中 ,这 起 交通 
车 以 及 没有 确保 刹车 的 可 靠 性 ) 超 定 的 ， 


无 论 如 何 都 


和 故 是 由 两 个 缺 位 ( 没有 踩 刹 
这 两 个 缺 位 中 的 任何 一 个 都 会 
， 所 以 尽管 刹车 有 问题 





， 但 
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是 它 并 没有 机 会 导致 事故 的 发 生 。 如 果 司 机 踩 了 刹车 ， 那 这 件 事 就 不 是 
TARE, 但 因为 司机 不 知道 刹车 有 问题 ， 而 且 也 没有 采取 恰当 的 安全 
保护 措施 ， 所 以 这 个 案件 中 应 该 承担 责任 的 是 司机 。” 

在 超 定 案例 中 ， 两 个 或 两 个 以 上 的 因素 都 可 能 是 导致 某 个 结果 的 原 
因 ,， 其 中 任何 一 个 都 无 法 被 判定 为 导致 某 种 结果 的 唯一 原因 。 相 反 , 在 优 
先 权 案例 中 , 可 能 导致 某 种 结果 的 因素 有 两 个 , 但 实际 上 起 作用 的 因素 只 


有 一 个 



















































































。 比 如 说 , 一 个 病人 得 了 致命 的 疾病 ， 在 他 死 于 疾病 之 前 ,护士 先 


撤去 了 各 种 帮 他 维持 生命 的 设备 。 
有 一 项 针对 30 名 法 学 院 新 生 的 人 学 调查 。 调 查 的 问题 是 : 在 那 起 刹 




















EHN 











题 的 交通 事故 中 ,过 错 方 是 谁 ? 占 比 最 高 (43% ) 的 回答 是 刹车 和 











司机 应 该 共同 对 这 起 事故 负责 。 还 有 33% 的 同学 认为 过 错 方 在 司机 , 23% 
的 同学 认为 过 错 方 在 刹车 。 “有 些 给 陪审 团 的 指示 中 也 明确 提出 了 这 个 问 
题 : 在 这 种 超 定 案例 中 ， 两 个 因素 都 可 以 被 看 成 是 导致 某 种 结果 的 原因 ; 
































或 者 陪 





审 员 应 该 更 加 详细 地 考察 原因 造成 的 结果 ， 就 像 Lewis 修改 后 的 方 

















法 。Lewis 提出 ， 如 果 两 名 纵火 犯 分 别 放 了 两 把 火 ， 那 这 两 把 火 吞 没 房子 


的 速度 











比 只 有 一 把 火 要 快 得 多 , 由 此 时 致 的 结果 不 只 是 房子 被 烧毁 那么 简 





单 ， 而 是 房子 在 30 分 钟 内 而 不 是 在 90 分 钟 内 被 烧毁 的 问题 ， 而 这 种 时 间 
上 的 缩短 可 能 就 是 人 们 无 法 将 火 扑灭 的 原因 。” 

在 上 述 案例 中 ， 常 规 的 反 事实 推理 法 是 没有 用 的 。 如 果 使 用 常规 的 
反 事 实 推理 法 , 我 们 会 发 现 这 两 名 纵火 犯 都 不 是 房子 被 烧毁 的 原因 ( 因为 
总 有 一 个 备用 原因 )。 然 而 从 直觉 上 来 看 ， 两 名 纵火 犯 似乎 都 要 承担 一 些 
责任 。 反 事实 推理 法 的 缺陷 之 一 在 于 ,这 种 方法 是 将 每 一 个 原因 分 开 考虑 ， 
而 不 是 将 每 个 原因 当 作 导致 某 种 结果 的 整体 背景 中 的 一 部 分 。 因 此 ， 
Richard Wright 提出 了 一 个 叫 作 NESS ( 充分 条 件 组 合 中 的 必要 成 分 ) 的 理 








论 框架 



















































































， 这 个 框架 与 Mackie 的 INUS 条 件 类 似 , “其 主要 思想 是 : 如 果 某 











个 事件 是 一 个 充分 〈sufficient ) 条 件 组 合 (set) 中 的 必要 (necessary ) 成 
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分 (element )， 那 么 这 个 事件 就 是 一 个 原因 。 这 意味 着 ， 如 果 整 个 充分 条 
件 组 合 都 出 现 了 , 那么 结果 就 一 定 会 出 现 , 而 原因 只 是 充分 条 件 组 合 中 的 
一 个 成 分 ; 相反 ,如 果 充 分 条 件 组 合 中 缺少 某 一 个 成 分 , 那 结果 就 一 定 不 
会 出 现 。 在 汽车 交通 事故 案例 中 , 刹车 失灵 是 整个 充分 条 件 组 合 中 的 一 部 
分 ， 而 没有 躁 刹车 则 是 充分 条 件 组 合 中 的 另 一 部 分 。 那 么 ,这 两 者 都 是 
NESS 条 件 。 根 据 NESS 理论 框架 ,它们 似乎 都 难 辞 其 答 。 

然而 ， 在 这 个 案例 中 ， 要 想 找到 正确 的 答案 还 需要 考虑 因果 推理 以 
外 的 因素 。 当 我 们 说 “考虑 到 驾驶 员 当 时 所 掌握 的 交通 知识 , 他 应 该 按照 
某 种 特定 的 方式 来 采取 相应 的 行为 ( 即使 他 采取 的 行为 并 不 会 改变 撞车 的 
结果 关 ， 我 们 其 实 是 将 这 起 交通 事故 的 过 错 归 到 了 驾驶 员 身 上 ， 因 为 他 
没有 按照 道路 交通 规则 采取 相应 的 措施 。 这 就 又 回 到 了 我 们 在 第 2 章 讨论 
的 责任 划分 的 问题 上 了 一 一 人 们 似乎 会 考虑 当事人 有 没有 违反 某 个 行为 


规范 。 





























































































































8.5.2 EA 





hie AMR TRASH. T KEWER, E TME ETER 
街道 的 路 人 。 路 人 驻足 观望 , 结果 导致 一 辆 正在 朝 他 骑 过 来 的 自行 车 不 得 
不 在 最 后 一 秒 急 转车 头 。 自行 车 避让 行人 后 , 正好 骑 到 了 一 辆 出 租车 行驶 
的 车 道上 。 出 租车 为 了 避让 自行 车 , 结果 撞 上 了 一 个 消防 栓 。 消 防 栓 出 水 
导致 附近 一 栋 大 楼 的 地 下 室 被 淹 , 破坏 了 地 下 室 的 供电 设施 。 虽然 吓 走 铝 
子 是 启动 整个 原因 链 的 原因 , 我 们 也 可 以 认为 是 吓 走 鸽 子 这 件 事 导致 了 后 
面 的 一 系列 事件 , 但 很 少 有 人 会 认为 吓 走 铝 子 的 那个 人 应 该 对 之 后 出 现 的 
一 系列 事件 负责 一 一 即使 很 多 人 都 同意 是 那个 人 引起 了 这 一 系列 的 事件 。 
因此 ， 一 个 没有 责任 方 的 事故 仍 有 可 能 存在 一 个 原因 。 
除了 要 考虑 “要 不 是 ”原因 并 进行 NESS 测试 以 外 , 我 们 还 需要 掌握 
原因 和 结果 之 间 的 距离 , 以 便 解 释 原 因 和 结果 之 间 发 生 的 那些 有 可 能 干预 






















































































并 改变 结果 的 
具有 可 预见 怕 




















还 
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! 间 事件 。 近 因 就 是 和 结果 直接 相连 的 原因 。 法律 上 的 近 因 
E, 也 就 是 说 ， 人 人 
果 。 但 在 吓 走 鸽子 的 案例 中 , EAE. HA, META 





门 应 该 能 够 预见 该 原因 可 能 会 导致 某 个 结 








可 能 





是 一 个 “要 不 是 ”原因 ， 却 不 是 近 因 。 


Š] 
AE 


近 因 才 
可 以 防止 人 1 








和 所 其 
F 


TE 





归 





我 们 用 来 区 分 因果 关系 和 责任 的 因素 。” 将 责任 局 限于 近 因 
咎 于 那些 遥远 的 事 伯 











-那些 遥远 的 事件 可 能 触发 了 一 














系列 事 伯 


F, 但 是 最 终 导致 的 


EE 























是 





却 是 无 法 预见 的 。 前 面 说 过 ,可 传递 性 

















反 事 实 推理 等 方法 


还 可 能 会 发 现 某 件 事 情 有 时 和 角 
Ey. Ha 











~ 


发 4 





式 使 
xt 
A 


Ba 





的 饭 让 自己 也 食物 














NF if 























' 的 一 个 


要 缺陷 。 我 们 除了 会 发 现 遥 远 的 原因 以 外 ， 
够 避免 某 个 结果 , 但 实际 上 又 通过 另 一 种 方 





b 
已 





j 这 种 情况 : 由 于 出 租车 司机 车 开 得 太 慢 ,导致 你 
了 一 场 晚宴 , 那 场 晚 实 中 的 所 有 人 者 
MÉZ, 所 以 你 自己 在 家 做 了 饭 , 但 








出 现 了 食物 中 毒 的 症状 。 由 于 未 
1 于 一 些 偶然 的 因素 ,你 自己 做 


下 二 


Lo 























= 1 











中 毒 是 由 于 自己 做 





再 














饭 导 致 的 。 


举 一 个 更 加 实际 的 案例 : 在 一 场 凶杀 案 中 ， 受 
他 在 接受 治疗 时 没 能 得 到 医务 人 员 足 够 的 如 





eS. A 


在 家 做 饭 是 因为 出 租车 开 得 大 慢 , 而 食物 


Lo 


4 


Ga 





者 受 了 习 
EWL, ， 因 此 而 死 掉 了 。 


Epi 





虽然 


S 





> 
了 








杀 案 是 导致 他 需要 医治 的 原因 , 但 在 一 些 极端 的 情况 下 ( 比如 医生 们 的 行 


为 严重 违背 了 常规 处 理 流程 以 及 医疗 护 形 


程 才 是 导致 死亡 的 


1956 年 ， 英国 
过 者 被 刺 伤 了 , 但 受害 者 的 死亡 并 不 是 受伤 导致 的 , 而 是 医疗 过 程 导致 
害 者 在 被 刺 伤 后 , 他 的 处 境 


ny 





La 


的 。 “最终 被 告 的 





止 感染 ,医生 让 他 


让 他 停止 服用 抗生素 。 但 是 , 男 一 名 医 4 
重新 开始 服用 抗生素 。 在 对 受害 者 进行 尸检 后 发 现 , 受害 者 是 因为 服 

















H 六 4 
RAN A 











出 现 了 一 


“明显 有 误 ”), 有 人 认为 治疗 过 





起 非 同 寻常 的 案件 。 在 一 起 谋杀 案 中 ， 一 名 

















| 判决 被 成 功 推翻 。 在 这 个 案件 中 , 受 























IRH T HtA 


已 经 得 到 了 改善 
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， 病 情 也 稳定 了 下 来 。 为 了 防 








E 素 。 之 后 ， 他 出 现 了 过 敏 反应 ， 于 是 医生 就 














E 却 无 视 他 之 前 的 过 敏 反 应 , 让 他 
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果 关 系 简 易 入 门 








令 他 过 敏 的 药物 ,并且 静 脉 液体 过 多 引起 了 肺 部 液体 过 多 才 致 死 的 。 因 此 ， 











人 们 认为 对 受害 者 的 治疗 过 程 打 破 了 受害 者 从 受伤 到 
系 链 。” 





死亡 之 间 的 因果 关 


另 一 方面 ， 近 因 并 不 一 定 非 要 在 邻近 结果 之 前 才 出 现 ， 只 要 它 能 与 
结果 的 发 生 清晰 地 连 在 一 起 就 行 。 罗 纳 德 ， 里根 总 统 的 新 闻 秘 书 叫 James 
Brady， 人 们 在 他 死 后 对 他 进行 了 尸检 ， 结 果 发 现 他 的 死亡 实际 上 由 一 起 


























邮 杀 案 导 致 的 ， 因 为 他 在 30 多 年 前 的 一 起 凶杀 案 中 


:过 枪 。 这 就 是 一 起 























被 滞后 的 多 杀 案 。 在 这 种 凶杀 案 中 , 受害 者 会 在 很 长 


段 滞后 期 后 才 由 于 





受伤 而 死亡 。 ”在 这 个 案例 中 , 30 多 年 的 时 间 间 隔 让 近 因 暂 时 变 成 了 遥远 
的 原因 , 但 由 于 有 证 据 显示 枪 伤 才 是 真正 致死 , 所 以 验尸 员 将 他 的 死亡 判 





定 为 凶杀 致死 。 


8.5.3 ”陪审 团 

















在 日 常生 活 中 ， 当 我 们 想 要 解释 一 些 事件 的 时 候 ， 可 以 寻找 新 的 信 
息 来 支持 或 者 否定 我 们 的 假设 。 比 如 说 ， 你 可 以 去 咨询 尽 可 能 多 的 专家 ， 





问 问 他 们 你 隔壁 房子 过 于 花哨 的 装饰 是 否 会 降低 你 房子 的 市 值 。 你 可 以 审 
查 每 一 个 专家 的 资格 信息 、 阅 读 关于 房价 的 研究 报告 并 且 进 行 一 些 实验 ， 
等 等 。 而 陪审 团 成 员 面 对 的 则 是 一 组 他 们 无 法 控制 来 源 的 事实 。 在 某 些 案 
件 中 ， 陪 审 员 也 许 能 够 向 证 人 提 一 些 问题 , ”但 在 绝 大 部 分 情况 下 ， 他 们 

















只 能 评估 并 整合 证 据 ， 而 不 能 直接 获得 证 据 。 





























所 有 这 些 复杂 的 证 据 信 息 可 能 都 不 是 按照 时 间 顺 序 提供 给 陪审 员 
的 。 面 对 这 样 的 信息 , 陪审 员 如 何 才能 将 它们 结合 在 一 起 来 搞 清 楚 究竟 发 











生 了 什么 事情 呢 ? 





陪审 员 在 听 审 的 过 程 中 不 会 把 每 一 条 新 的 证 据 都 放 进 互 不 相干 的 证 
据 库 中 , 以 便 最 后 一 次 性 对 所 有 证 据 做 一 个 评估 ; 也 不 会 在 每 一 个 时 间 点 



































对 已 有 的 证 据 做 一 个 总 结 ， 然 后 记 一 份 被 告 有 罪 或 无 








的 流水 账 。 ”大 部 
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分 人 都 认为 陪审 员 在 庭审 过 程 中 会 将 获取 的 信息 组 织 成 一 个 故事 。 这 种 故 
事 模型 论 最 早 由 Nancy Pennigton 和 Reid Hastie 提出 ， 讲 的 是 陪审 员 们 会 
将 庭审 提供 给 他 们 的 证 据 〈 以 及 他 们 对 证 据 的 评估 ) 和 他 们 的 先 验 知 识 
以 及 经 验 结合 在 一 起 ， 组 织 出 一 个 故事 来 再 现 案情 。 障 审 员 们 会 对 同 
个 案件 得 出 不 同 的 结论 这 可 能 是 由 于 他 们 构建 了 不 同 的 案情 故事 。 这 一 点 
正如 Reid 和 Hastie 在 一 次 实验 中 发 现 的 情况 一 样 。” 

对 一 名 陪审 员 来 说 ， 什 么 样 的 故事 才 是 可 信 的 ? 这 个 问题 一 部 分 取 
决 于 陪审 员 的 经 验 , 男 一 部 分 取决 于 这 个 故事 对 证 据 的 解释 力 (这 个 故事 
到 底 能 够 解释 多 少 证 据 )。 一 名 陪审 员 对 其 构建 的 故事 的 信心 取决 于 三 个 
关键 因素 : 故事 的 覆盖 面 、 连 贯 性 和 独特 性 。 如 果 某 个 人 有 一 份 确 沿 的 不 
在 场 证 明 , 那么 那些 认为 这 个 人 在 案件 中 起 着 必 不 可 少 的 作用 的 故事 就 不 
可 信 了 。 因为 这 些 故 事 无 法 解释 这 份 表明 这 个 人 无 罪 的 证 据 。 这 就 是 一 个 
故事 的 覆盖 面 问题 。 同 理 , 一 个 故事 必须 以 一 种 连贯 的 方式 组 成 一 个 整体 。 
如 果 一 名 陪审 员 发 现 一 名 案件 侦查 员 不 可 能 会 算 改 证 据 , 或 者 案件 侦查 员 
算 改 证 据 的 这 个 假设 与 故事 的 其 余部 分 相 矛 盾 ( 在 故事 的 其 余部 分 , 案件 
侦查 员 没 有 任何 算 改 证 据 的 动机 )， 那 么 那些 具有 这 种 特征 的 故事 就 不 是 
连贯 的 故事 。 在 某 些 情况 下 , 可 能 会 出 现 多 个 与 证 据 相 一 致 的 可 能 发 生 的 
故事 。 如 果 很 多 故事 都 是 连贯 的 , 那么 陪审 员 就 无 法 确定 哪 一 种 解释 最 有 
可 能 发 生 。 相反 , 如 果 有 一 个 独一无二 的 、 连 贯 的 并 且 有 覆 盖 面 很 广 的 故事 ， 
那么 他 们 很 有 可 能 会 用 这 个 故事 来 解释 整个 案情 。 

然而 ， 这 并 不 意味 着 所 有 陪审 员 构 建 的 故事 都 是 一 样 的 ， 也 不 意味 
着 他 们 会 接受 同一 个 故事 。 一 个 陪审 员 相信 的 事 , 也 许 另 一 个 陪审 员 并 不 
相信 。 如 果 我 曾 有 过 直接 经 验 , 发 现 有 学 生 在 很 不 重要 的 家 庭 作 业 中 作弊 ， 
却 又 声 称 自己 是 无 率 的 , 那 我 可 能 就 会 构建 出 这 样 一 个 和 这 个 学 生 自 己 的 
证 词 相 矛 盾 的 故事 : 该 生 在 作弊 的 问题 上 撒谎 了 。 相 反 , 那些 没有 这 种 经 
验 的 人 可 能 会 发 现 这 个 故事 很 不 可 信 : 怎么 会 有 学 生 在 做 对 成 绩 影 响 极 小 
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果 关 系 简 易 入 门 





REELE? 而 且 他 们 在 构建 故事 的 过 程 中 可 能 还 会 给 该 生 的 


证 词 赋予 更 大 的 权重 。* 

















庭审 最 具 挑 战 性 的 特征 之 一 是 : 证 据 是 随 着 时 间 而 逐条 提供 给 陪审 
员 的 ， 却 不 一 定 是 按照 时 间 顺 序 提供 给 陪审 员 的 。” 因 此 , 一 名 陪审 员 一 
开始 构建 的 故事 可 能 是 这 个 学 生 没有 作弊 , 他 的 家 庭 作 业 是 在 他 不 知情 的 















































情况 下 被 别人 抄袭 了 。 后 来 有 几 个 新 的 证 人 说 看 到 他 参与 了 作弊 。 但 是 ， 
必须 要 将 这 个 新 的 信息 加 入 到 一 开始 构建 的 故事 中 去 。 而 且 由 于 很 多 证 据 




















都 不 是 相互 独立 的 , 问题 就 变 得 更 加 复杂 了 。 如 果 我 们 相信 证 人 的 话 而 不 





相信 该 生 说 自己 没有 参与 作 浆 的 训 
会 降低 。” 








EWI, 那么 该 生 其 他 证 词 的 可 信 度 可 能 





很 多 关于 陪审 团 如 何 思考 问 


题 的 实验 性 证 据 来 自 于 人 们 针对 模拟 陪 














审 团 的 大 量 研究 。” 但是， 这 些 模 
要 特征 。 在 真实 审判 中 , 陪审 团 可 
wl, 也 可 能 会 因为 案情 重大 ( 比如 



































拟 活动 可 能 没有 抓 住 真实 审判 的 一 些 重 
能 会 被 时 间 跨 度 很 长 的 信息 搞 得 焦 头 烂 
陪审 团 的 任务 是 判定 一 个 真实 的 人 是 否 








该 判 死 刑 ,而 模拟 法 庭 是 做 一 些 没有 任何 实际 影响 的 决定 ) 而 有 不 同 的 行 











为 表现 。 除 此 之 外 , 陪审 团 成 员 的 i 











先 择 流程 本 身 可 能 也 会 导致 真实 案件 中 











的 陪审 团 成 员 与 模拟 法 庭 中 陪审 团 成 员 来 自 于 完全 不 同 的 人 群 。 
然而 , 真实 陪审 团 的 审议 过 程 一 般 是 不 公开 的 。” 但 亚利桑那 州 录影 

















项 目 是 个 例外 , 这 个 项 目 记 录 了 多 个 完整 的 审判 过 程 , 并 且 对 这 些 庭审 过 
程 进行 了 分 析 ， 其 中 就 包括 陪审 团 的 审议 过 程 。” 研 究 人 员 发 现 ， 在 他 们 
































研究 的 50 起 民事 案件 中 ， 陪 审 员 














确实 针对 这 些 证 据 构建 了 不 同 的 故事 。 





他 们 有 时 通过 讨论 共同 构建 一 个 故事 ， 有 时 则 是 在 对 证 据 进行 评估 的 时 


候 ， 对 彼此 的 故事 提出 质疑 。“ 下 











面 是 陪审 员 们 在 一 次 庭审 过 程 中 的 某 一 








次 讨论 的 部 分 内 容 ， 此 时 案件 的 说 


E 据 尚未 完全 提交 给 陪审 团 。” 





先后 顺序 。 他 们 不 确定 当时 的 交通 指示 灯 是 红色 还 是 黄色 。 陪 审 员 7 号 用 
一 个 事实 〈 灯 是 红色 的 ) 和 一 个 解释 (由 于 被 告 身 处 十 字 路 口 ， 所 以 他 不 
得 不 继续 往 前 开 ) 来 阐明 了 这 个 问题 。 
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陪审 员 1 号 : 他 (原告 ) 说 他 是 在 看 到 黄 灯 时 提速 的 ， 提 速 
之 后 灯 才 变 红 的 。 这 一 点 我 没 再 明白 一 一 (原告 ) 看 到 (被告 ) 
闻 的 是 黄 灯 还 是 红 灯 呢 ? 

陪审 员 7 号 : AMEN, 但 他 不 得 不 往 前 开 ， 因为 他 被 困 
在 路 中 间 了 。 

陪审 员 1 号 : 但 是 还 有 一 次 ,他 (原告 ) 说 他 知道 另外 一 个 
人 看 到 交通 灯 的 颜色 在 变 ， 所 以 他 (被告 ) 提速 了 ， 也 有 可 能 那 
是 ( 另 一 个 证 人 ) 告诉 他 的 话 。 那 里 并 没有 左 转 箭 头 。 

SER 7 号 : 如 果 你 看 到 有 人 加 速 , 你 会 怎么 办 ? 我 就 坐 在 


那里 。 

陪审 员 1 号 : 对 呀 。 

陪审 员 6 号 :所 以 我 们 要 看 看 法 官 怎么 说 …… 这 个 州 的 法 律 
条 文 是 怎么 规定 的 ? 

陪审 员 1 号 : 对 ， 和 车 辆 不 应 该 在 十 字 路 口 停留 …… 

陪审 员 6 号 : 但 是 没有 打转 向 灯 , 对 吗 ? 没有 箭头 ? MLE 
十 字 路 口 干 什么 ? 


陪审 员 7 号: 我 们 需要 有 证 人 来 告诉 我 们 他 有 没有 冯 红 灯 。 


在 这 个 讨论 中 ， 陪 审 员 想 要 搞 清楚 一 起 交通 事故 中 各 个 事件 发 生 的 
























































陪审 员 们 对 原告 证 词 的 可 信 度 提出 


质疑 , 因为 他 的 证 词 似乎 发 生 了 改变 ; 陪审 员 们 质疑 他 证 词 的 内 容 是 他 直 


接 观 察 到 的 还 是 听 别 人 说 的 ; 然后 陪审 员 1 





T 





门 又 将 这 些 故 事 和 他 们 自身 的 4 


活 经 验 结合 了 起 来 。 最 后 , 他 们 讨论 了 还 需要 什么 证 据 才能 弄 明 白 证 人 的 





证 词 。 
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果 ! 因果 关系 简易 入 门 








昌 然 这 和 我 们 在 日 常生 活 中 解释 一 些 事件 的 方法 是 一 样 的 ， 但 不 同 











的 是 , 他们 审查 每 一 





个 原因 寻找 无 罪 和 有 3 





条 证 据 的 严密 程度 和 这 些 证 据 的 结合 程度 。 不 过 ， 人 
们 在 提出 各 种 阴谋 理论 时 , 通常 会 主动 忽略 那些 相互 矛盾 的 信息 , 他 们 一 
方面 寻找 能 够 证 实 他 们 理论 的 证 据 , 男 一 方面 又 试图 将 证 据 纳 入 这 些 理论 
之 中 。 这 个 审判 过 程 为 我 们 提供 了 一 个 解释 各 种 事件 的 框架 : 首先 要 为 一 









































的 证 据 ,然后 严格 审查 现 有 的 证 据 以 确定 事情 的 丰 








相 ， 最 后 判定 到 底 是 只 有 一 个 可 信 的 解释 还 是 有 多 个 可 信 的 解释 。 
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.关于 这 个 故事 的 详细 描述 ， 参 见 Vlahos (2012 )。 
.参见 Lange (2013 )。 


想 要 了 解 历 史上 关于 因果 关系 解释 的 更 多 内 容 ， 参 见 Scriven (1966 )。 











1938 年 糕点 战争 是 由 于 墨 西 














村 一 家 法 国 糕点 店 遭 到 破坏 而 引起 的 。 
F 这 方面 的 信息 ， 参 见 Hausman (2005 )。 想 要 了 解 人 们 














关于 这 些 困 难 的 一 些 讨论 ， 参 见 Hitchcock (1995 )。 





. Mandel ( 2003 )。 





想 要 回顾 一 下 这 方面 的 内 容 ， 参 见 Sloman Fil Lagnado (2015 )。 
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10. Lewis ( 2000 )。 


11. 很 多 研究 表明 受训 


想 要 了 解 更 多 这 方 


面 的 例子 和 实验 ， 参见 Spellman 和 Kincannon (2001 )。 
. Cooke (2009 ); Cooke 和 Cowling (2006 )。 














的 运动 员 








此 反应 ， 但 也 有 人 证 实 那些 原本 不 活动 的 参 








与 者 在 参加 一 个 锻炼 项 目 之 后 ， 也 会 出 现 这 一 效应 ; 想 要 了 解 这 方面 的 例 
子 ， 参见 Tulppo 等 (2003 )。 


12. 想 要 了 人 解 相反 的 观点 








认为 主体 性 在 这 里 指 的 是 一 个 特征 而 不 是 一 个 漏 


























洞 的 观点 ， 参 见 Halpern 和 Hitchcock (2010 )。 


13. Dalakas ( 1995 )。 


14. 想 要 了 解 医学 领域 关于 这 种 不 确定 性 的 研究 ， 参 见 Hripesak 等 (2009 )。 








15. 想 要 进一步 了 解 关 于 这 一 方法 的 讨论 ,参见 Kleinberg (2012 )。 

16. 这 一 想法 被 称 为 连接 原则 ， 是 由 Sober Fl Papineau ( 1986 ) 提出 的 。 
17. 关于 这 一 方法 更 全 面 的 介绍 ， 
18. 关于 概率 轨迹 的 各 种 讨论 ， 参 见 Eells (1991 )。 





























参见 Kleinberg (2012 )。 
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19. Eells (1991 ) 还 定义 了 另外 两 种 关系 。 当 概率 不 发 生 任何 变化 时 ， 结 果 独 
立 于 原因 ; 当 概 率先 变 大 又 变 小 时 ( 比如 第 一 次 接触 流感 的 案例 )， 结 果 

自主 发 生 。 

20. 大 部 分 方法 都 将 注意 力 放 在 高 级 算法 上 ， 而 不 是 方法 的 具体 运用 和 实施 
Es Dash (2013) 是 一 个 例外 。 

21. 想 要 了 解 这 个 经 典 文本 ， 参 见 Hart Fl Honoré ( 1985 )。 

22. 桑 德 斯 系统 伯明翰 有 限 公司 诉 亚当 斯 (1928 )。 

. 想 要 深入 了 解 人 们 关于 这 个 案例 和 相关 法 律 的 讨论 , 参见 Wright (2007 )。 

24. Fischer ( 2006 )。 想 要 了 解 更 多 关于 直觉 与 法 律 判断 的 内 容 ， 也 参见 
Fischer ( 1992 )。 

25. 想 要 深入 了 解 人 们 关于 这 种 案例 的 讨论 ， 参 见 Spellman 和 Kincannon (2001 )。 
该 文 还 提供 了 不 同 陪审 团 需要 遵守 的 规则 实例 。 

26. 想 要 了 解 NESS 方法 的 一 些 问题 ,参见 Fumerton 和 Kress (2001 )。 

27. 想 要 了 解 更 多 信息 ， 参 见 Carpenter (1932); Wright ( 1987 )。 

28. Rv. Jordan ( 1956 )。 

29. 注 意 ， 关 于 这 个 案例 还 有 些 争 议 ， 而 且 还 有 观点 认为 这 个 案子 判 得 不 公 
正 。 参 见 White (2013 )。 

30. Lin 和 Gill (2009 )。 

31. 想 要 回顾 这 一 做 法 ， 参 见 Mott (2003 )。 

32. Lopes ( 1993 )。 

33. Pennington 和 Hastie ( 1992 )。 

34. 想 要 了 解 这 一 情况 在 O. J. Simpson 案 中 是 如 何 起 作用 的 ， 参 见 Hastie 和 
Pennington ( 1996 )。 

35. 想 要 了 解 更 多 关于 证 据 呈 现 顺 序 的 影响 ,参见 Pennington 和 Hastie ( 1988 )。 

36. 模拟 陪审 团 实 验 显 示 ， 陪 审 团 会 根据 相互 联系 的 证 据 而 拒绝 采信 一 些 证 据 

(Lagnado 和 Harvey，2008 )。 

37. Devine 等 (2001 )。 

38. 想 要 回顾 关于 真实 陪审 团 的 一 些 研究 ， 人 参见 Diamond Fil Rose (2005 )。 

39. Diamond 等 (2003 )。 

40. 想 要 了 解 更 多 陪审 团 得 出 的 案情 真相 ， 参 见 Conley 和 Conley (2009 )。 

41. Diamond 等 (2003 ), 38. 
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HIE 行动 


如 何 根据 原因 进行 决策 ? 








2008 年 ,纽约 市 通过 了 一 项 























法 案 ， 要 求 拥 有 15 家 以 上 分 店 的 连锁 餐 





厅 必 须 在 菜单 上 显著 标 出 每 种 食物 的 热量 值 。 这 项 法 案 背 后 的 依据 是 , 食 





























用 高 热量 食物 会 导致 肥胖 症 和 其 他 健康 问题 ， 而 餐厅 不 同 于 包装 食品 的 生 



























































产 商 ， 他 们 往往 不 会 在 菜单 上 标明 所 售 食物 的 营养 成 分 信息 。 如 果 人 们 知 














道 他 们 所 食用 的 食物 包含 多 少 热 量 的 话 ， 就 会 改变 自己 的 行为 。 然 而 ， 类 


似 的 政策 在 全 国 推广 了 以 后 ， 人 们 在 纽约 和 其 他 城市 展开 了 研究 ， 但 几乎 
没有 发 现 能 够 表明 这 些 法 案 有 这 种 效果 的 证 据 。) 
为 什么 会 这 样 呢 ? 在 菜单 上 标 出 热量 值 的 政策 假设 人 们 会 注意 到 











热量 信息 , 假设 在 没有 热量 信息 上 











的 情况 下 人 们 会 低估 食物 的 热量 值 , 假设 








人 们 知道 如 何 解读 和 使 用 热量 信 , 





息 ,并且 假设 这 个 政策 在 各 种 类 型 的 连锁 























餐厅 都 会 产生 同样 的 效果 。 这 项 政策 不 仅 没有 大 大 降低 人 们 购买 的 食物 的 














热量 值 ， 而 且 在 某 些 情况 下 ， 人 们 购买 的 食物 的 平均 热量 值 甚至 比 以 前 
更 高 。” 比如 ， 人 们 在 节食 或 者 评估 不 健康 食品 时 往往 会 高 估 某 些 食物 的 























热量 值 ，” 而 在 食物 所 含 真实 热量 信息 公布 之 后 ， 人 们 会 觉得 很 惊喜 ， 从 


而 去 点 一 些 热量 更 高 的 食物 。 





如 果 人 们 不 知道 该 如 何 使 用 这 些 热量 数据 ， 那 他 们 消耗 的 食物 的 热 
量 值 可 能 就 会 增加 , 或 者 说 至 少 不 会 下 降 。 要 想 让 热量 值 信息 改变 人 们 的 














第 9 章 行动 | 225 




















行为 , 我 们 必须 假设 消费 者 能 够 将 这 个 信息 融入 日 常 的 饮食 之 中 , 而 且 能 
够 理解 每 一 个 数据 的 含义 。 如 果 他 们 不 知道 每 一 顿 饭 所 需 的 热量 值 大 约 是 
多 少 ， 那 么 菜单 上 提供 的 热量 信息 就 没有 任何 意义 了 。 在 研究 中 ， 人 们 
不 仅 提供 了 食物 的 热量 信息 , 还 为 顾客 准备 了 一 些 传单 , 向 顾客 介绍 每 日 
最 佳 热量 摄 人 值 的 区 间 。 但 这 种 做 法 也 没有 对 人 们 点 的 食物 的 热量 值 产 生 
具有 统计 学 意义 的 显著 影响 。“ 不 过 ， 这 可 能 是 因为 人 们 在 来 饭店 之 前 已 
经 想 好 要 点 什么 了 , 所 以 在 销售 食物 的 时 候 为 人 们 提供 这 些 信息 就 有 点 为 
时 已 晚 了 。 这 种 信息 可 能 也 会 影响 人 们 的 行为 ,比如 他 们 以 后 会 选择 去 其 
他 饭店 吃饭 。 相 反 ， 关 于 停车 灯 体 系 ( 健康 的 食物 用 绿色 图 标 ， 而 最 不 健 
康 的 食物 用 红色 字体 标 出 ) 的 研究 发 现 , 有 很 多 证 据 能 够 表明 人 们 的 行为 
会 因为 使 用 了 停车 灯 体系 而 发 生 改变 。5 
只 有 极 少 数 的 几 项 研究 发 现 ， 菜 单 上 标 出 食物 热量 信息 的 做 法 是 有 
效果 的 。 其 中 有 一 项 研究 发 现 , 在 星巴克 ,几乎 完全 是 由 于 食物 购买 上 的 
变化 而 导致 人 们 点 的 食物 的 热量 有 些许 下 降 (6% )。“ 这 6% 的 下 降幅 度 
(平均 每 单 所 点 食物 的 热量 从 247 大 卡 下 降 到 232 大 卡 ) 绝 大 部 分 是 因为 
购买 的 食物 数量 减少 了 ， 而 不 是 因为 购买 了 热量 比较 低 的 食品 。 然 而 ,对 
于 一 家 咖啡 连锁 店 的 顾客 来 说 , 食物 可 能 不 过 是 顺带 购买 的 东西 。 至 于 这 
6% 的 下 降幅 度 到 底 有 没有 意义 ， 还 要 看 消费 者 在 其 他 饭桌 上 有 没有 将 减 
少 的 这 6% 的 热量 补充 回来 才能 确定 。 
1 于 不 同类 型 的 餐厅 提供 的 食物 种 类 和 面 对 的 顾客 群体 不 同 ， 而 不 
同 的 顾客 对 餐厅 又 有 着 不 同 的 期 待 , 所 以 研究 中 的 任何 效果 都 不 可 能 适用 
于 所 有 类 型 的 和 餐厅。 即便 我 们 发 现 人 们 的 购买 行为 发 生 了 变化 , 我 们 也 不 
能 立即 将 这 种 变化 归功 于 菜单 上 提供 的 食物 热量 信息 。 相反, 这 可 能 是 由 
于 和 餐厅 改变 了 他 们 的 菜单 , 减少 了 有 些 食 物 中 的 热量 , 或 者 在 不 得 不 公布 
热量 信息 之 前 将 一 些 食物 从 菜单 上 删 掉 了 。’ 虽然 这 可 能 在 某 种 意义 上 意 
味 着 我 们 的 法 案 通 过 让 和 餐厅 提供 更 加 健康 的 食物 选择 而 取得 了 成 效 , 但 这 
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BEI 


也 意味 着 我 们 可 





如 何 才能 根据 原因 进行 决策 呢 ? 仅 知 道 跑步 可 以 改 


果 关 系 简 易 入 门 





估 了 公布 食物 热量 信息 对 消费 者 行为 的 





ayes 
Sk 
i=] 











EY 
we 


啊 。 


心血 管 健康 状 


况 ， 并 不 一 定 意味 着 我 们 已 经 获得 了 足够 的 信息 来 决定 是 否 要 开始 跑步 ; 











Ab A 
HESS 





仅 知 道 钠 元 素 在 有 些 人 吴 上 可 
应 该 在 整个 人 群 中 实施 一 项 限 








| 发 高 血压 , 并 不 足以 让 我 们 决定 
判 食物 中 钠 含 量 的 政策 。 在 理想 情况 下 , 我 





日 
是 否 


们 会 进行 明确 并 严谨 的 实验 , 并 在 此 基础 上 决定 采取 什么 样 的 行为 ; 但 在 

















实际 生活 中 , 我 们 需要 在 信息 不 完整 也 不 完美 的 情况 下 采取 行动 。 在 某 些 
情况 下 ,我们 根本 无 法 进行 实验 , 在 另 一 些 情况 下 , 我们 可 能 没有 时 间或 











资源 等 到 有 了 HAG 














的 结论 再 采取 行动 。 

















但 是 ， 并 不 是 所 有 信息 都 是 同等 习 
寸 论 过 的 理论 综合 在 一 起 , 形成 一 组 需要 注意 的 事项 , 以 此 来 评估 各 种 
假设 。 我 们 将 会 讨论 我 们 到 底 需 要 什么 样 的 信息 来 支持 某 个 因果 假设 ， 
F 据 能 够 证 明 某 个 因果 关系 中 含有 这 些 特 征 。 虽 然 因明 
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系 的 一 个 基本 特 生 


F 就 是 原因 能 够 提高 某 个 








EE 

















要 的 。 在 这 一 章 ， 我 们 会 将 之 前 

















RK 











发 生 的 概率 , 但 是 呈现 这 一 


特征 的 方式 也 各 不 相同 , 这 就 有 可 能 让 人 们 得 出 完全 不 同 的 结论 。 找到 原 
只 是 第 一 步 , 要 想 针 对 整个 人 群 以 及 每 个 个 体 成 功 地 制定 一 些 政策 , 我 
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Co 





们 还 需要 更 多 的 信 ， 








志 来 改善 顾客 的 健康 状况 , 还 是 选择 一 利 





药物 来 组 





当 我 们 决定 采取 行动 时 , 无 论 是 通过 改变 饭店 的 标 
解 头疼 症状 , 我 们 所 做 








的 都 不 仅 是 在 确定 是 否 要 去 做 某 个 具体 的 事情 , 而 是 在 能 够 导致 同一 结果 





的 很 多 方法 中 做 出 选择 








没有 任何 效果 , 或 者 可 能 会 导致 副作用 ( 既 有 积极 的 副作用 





作用 ), 所 以 , 我 们 将 讨 





Pa 








一 个 原因 出 现 的 同时 可 能 还 会 改变 其 








论 如 何 预测 干预 措施 的 效 曙 
此 外 ， 并 不 是 所 有 的 原因 都 能 经 得 起 干预 措施 的 考验 ， 而 ] 





他 一 些 事 














R, AE 





物 。 所 以 , 我 


o 一 个 原因 可 能 在 一 个 地 方 有 效 , 但 在 另 一 个 地 方 


El 











也 有 消极 的 副 
更 好 的 选择 。 
日 干预 措施 让 
门将 考察 为 何 
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需要 考虑 要 使 用 哪 一 个 原因 来 引发 某 种 结果 ( 比如 公布 食物 的 热量 值 或 者 
强制 要 求 公布 食物 的 热量 值 )， 还 会 考察 如 何 让 某 种 结果 出 现 〈 比如 对 公 
布 食物 热量 值 的 饭店 给 予 奖 励 ， 或 者 对 不 公布 食物 热量 值 的 饭店 予以 处 
罚 )， 以 及 当 结 果 出 现时 ， 还 有 其 他 什么 可 能 会 因此 而 发 生 改变 的 事情 
( 比如 和 餐厅 更 改 了 菜单 ， 低 热量 值 的 甜 味 剂 的 消耗 量 增 加 了 )。 



































9.1 ”对 因果 假设 的 评估 





没有 任何 一 个 测试 因果 关系 的 方法 能 够 适用 于 所 有 的 情况 ， 但 在 面 
对 实际 问题 时 ,我 们 仍 需要 做 出 因果 假设 并 对 其 进行 评估 。 电 视 剧 《十 六 
岁 的 怀孕 女孩 》 真 的 像 该 剧 宣传 的 那样 能 够 降低 播放 该 剧 的 地 区 青少年 
怀孕 的 比例 吗 ?“ 我 们 没有 随机 挑选 任何 人 来 观看 这 部 电视 剧 ， 而 且 在 大 
部 分 情况 下 , 我 们 甚至 都 不 知道 某 些 人 有 没有 观看 这 部 电视 剧 。 从 理论 上 
来 讲 , 我 们 可 以 随机 分 派 一 些 青少年 去 观看 不 同 的 电视 节目 , 但 由 于 现实 
中 青少年 怀孕 的 情况 十 分 少见 , 所 以 我 们 根本 找 不 到 足够 大 的 样本 库 来 观 
察 观 看 这 部 电视 剧 的 效果 。 

我 们 已 经 讨论 过 如 何 成 功 使 用 随机 试验 去 寻找 事件 发 生 的 原因 ， 但 
在 很 多 情况 下 , 我 们 都 做 不 了 这 样 的 试验 。 这 时 , 我 们 需要 对 其 他 证 据 进 
行 评 估 ， 以 此 来 确定 某 种 关系 是 因果 关系 的 可 能 性 。 不 仅 如 此 , 我 们 从 理 
想 并 完美 的 随机 试验 中 了 解 到 的 信息 与 我 们 从 任何 给 定 的 真实 试验 中 了 
解 到 的 信息 也 是 不 同 的 。 真 实 的 试验 可 能 并 非 盲 法 试验 , 试验 的 样本 可 能 
会 很 小 , 而 且 在 试验 的 过 程 中 , 很 多 参与 者 可 能 在 试验 还 未 结束 时 就 已 经 
退出 了 。 

RCT 在 任何 情况 下 都 比 观察 性 研究 要 好 , 这 种 说 法 是 不 准确 的 。 对 于 
一 个 要 在 不 同治 疗 方案 中 做 出 选择 的 病人 来 说 ， 如 果 一 边 是 一 项 大 规模 、 
长 期 且 针 对 与 她 的 症状 完全 一 样 的 病人 群体 的 观察 性 研究 , 而 男 一 边 是 一 
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个 规模 很 小 的 并 且 针 对 与 她 的 病症 不 同 的 男性 病人 ( 而 且 她 已 经 试 过 其 他 
几 种 治疗 方案 , 都 没有 见 到 任何 效果 , 而 这 些 男性 病人 还 没有 试 过 其 他 几 
种 治疗 方案 ) 的 随机 试验 , 那么 在 这 种 情况 下 ,前 者 可 能 会 为 她 的 决策 提 
供 更 好 的 证 据 。 这 正 是 我 们 在 第 7 章 讨论 过 的 外 部 有 效 性 问题 。 如 果 RCT 
并 不 适用 于 我 们 将 要 干预 的 情况 , 那么 这 个 试验 就 不 是 针对 这 种 情况 来 采 
取 干 预 措施 的 最 佳 证 据 。 即 使 事件 发 生 的 背景 是 一 样 的 , 观察 性 研究 ( 这 
种 研究 可 能 会 重新 使 用 现 有 数据 ， 比 如 电子 病历 数据 ) 能 够 做 的 事情 与 
RCT 能 够 做 的 事情 可 能 也 有 所 不 同 。 如 果 我 们 想 知 道 坚 持 不 懈 地 锻炼 几 
十 年 会 对 人 们 的 衰老 过 程 产生 怎样 的 影响 , 以 此 来 指导 我 们 制定 当下 的 公 
共 政 策 ， 那 么 一 边 是 过 去 50 年 来 对 数 万 人 的 观察 性 研究 ， 男 一 边 是 针对 
100 名 参与 者 进行 的 为 期 两 年 的 RCT, 两 者 相 比 , 前 者 的 指导 效果 可 能 
要 更 好 。 尽 管 RCT 常 被 当 作 衡量 因果 假设 证 据 的 黄金 标准 ,但 即使 没有 
实验 研究 , 我 们 依然 可 以 掌握 事件 发 生 的 原因 。 因 此 , 我 们 有 必要 知道 如 
何 去 评 估 非 实验 性 证 据 。"” 
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20 世纪 60 年 代 ，Bradford Hill 提出 了 一 组 在 评估 因果 假设 时 需要 考 
虑 的 因素 。 ”这些 因素 有 时 会 被 误 认 为 是 验证 因果 关系 的 一 组 标准 或 者 一 
个 清单 。 虽 然 这 些 因 素 中 的 任何 一 个 因素 都 不 是 必要 条 件 ( 即便 不 是 所 有 
因素 都 出 现 了 ， 事 物 之 间 也 仍 有 可 能 会 存在 因果 关系 )， 而 且 整 个 因素 组 
合 也 不 是 充分 条 件 ( 即使 整个 因素 组 合 中 的 所 有 因素 都 出 现 了 , 这 个 案例 
中 的 因果 关系 可 能 也 是 虚假 的 ), 但 在 我 们 无 法 进行 实验 研究 的 时 候 ， 这 
个 因素 组 合 仍然 可 以 为 我 们 提供 一 些 需要 考虑 的 因素 , 并 且 能 够 将 我 们 前 
面 讨论 过 的 很 多 理论 结合 在 一 起 。* 

组 合 中 的 因素 大 致 可 以 分 为 两 种 类 型 : 第 一 种 类 型 的 因素 为 我 们 指 
明 某 个 原因 对 结果 产生 了 影响 ( 强度 、 一 致 性 以 及 生物 梯度 )， 第 二 种 类 
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型 的 因素 则 为 我 们 提供 了 证 据 , 这 些 证 据 表明 存在 着 某 种 可 以 让 某 个 原因 
对 结果 产生 上 述 影响 〈 特 异性、 时间 性 、 可 信和 度 、 连 贯 性 、 实 验 以 及 类 比 
性 ) 的 机 制 。 尽管 这 个 影响 因素 的 清单 与 Hill 提出 的 需要 考虑 的 因素 在 顺 
序 上 并 不 完全 一 致 , 但 下 面 的 内 容 里 还 是 保留 了 这 个 顺序 , 主要 是 为 了 方 
便 我 们 交叉 参考 关于 这 些 因 素 的 相关 论文 。" 在 对 这 些 因素 进行 评估 时 ， 

我 们 会 考察 其 中 的 每 一 个 因素 ， 同 时 也 会 提出 一 些 需要 进一步 思考 的 问题 。 


9.1.1 强度 


如 果 在 菜单 上 标 出 食物 的 热量 值 可 以 降低 人 们 在 点 餐 时 选 的 食物 的 
热量 值 , 那么 人 们 在 标 出 食物 热量 值 的 餐厅 里 所 点 的 食物 的 热量 值 应 该 明 
显 低 于 他 们 在 那些 没有 标 出 食物 热量 值 的 餐厅 里 所 点 的 食物 的 热量 值 。 同 
理 , 有 些 地 方 播放 了 有 关 青 少年 怀孕 问题 的 电视 节目 , 还 有 一 些 地 方 没有 
播放 这 样 的 电视 节目 , 如 果 前 面 那些 地 区 的 青少年 怀孕 率 只 比 后 面 那些 地 
区 略微 低 了 一 点 点 ,那么 用 这 种 数据 来 证 明 那 些 电 视 节 目 可 以 改变 青少年 
的 怀孕 率 就 没什么 说 服 力 了 。 相 反 ,， 如 果 在 上 述 两 个 案例 中 , 无 论 是 人 们 
所 食用 食物 的 热量 值 还 是 青少年 的 怀孕 率 都 显著 下 降 了 , 那么 这 样 的 数据 
就 能 够 更 加 有 力 地 证 明 事 物 之 间 的 因果 联系 。 这 与 因果 概率 法 ( 详 见 第 5 
章 ) 密切 相关 ,因果 概率 法 研究 的 就 是 在 某 个 原因 出 现 后 ， 某 种 结果 出 现 
的 概率 提高 的 幅度 。 这 种 方法 还 和 第 6 章 讨论 的 测量 因果 关系 强度 的 方法 
有 着 十 分 紧密 的 联系 。 强度 可 以 指 让 一 个 事件 发 生 的 可 能 性 更 大 ( 公布 食 
物 热量 信息 极 大 提高 了 人 们 购买 低热 量 食物 的 概率 ), 也 可 以 指 让 某 种 影 
响 的 力度 更 大 ( 公布 食物 热量 信息 导致 人 们 购买 的 食物 热量 降低 了 一 半 ) 
然而 ， 事 物 之 间 的 联系 不 强 并 不 意味 着 它们 之 间 就 没有 因果 关系 。 
因为 有 些 原 因 可 能 会 比较 弱 , 比如 吸 二 手 烟 导 致 肺癌 的 比例 要 比 吸烟 导致 
肺癌 的 比例 小 得 多 。 还 有 一 种 原因 很 弱 , 但 是 仍然 会 对 结果 产生 决定 性 的 
影响 : 所 有 遵循 某 个 节食 计划 的 人 , 体重 都 有 所 下 降 , 但 他 们 减 掉 的 重量 
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只 占 其 原 体重 的 很 小 一 部 分 。 还 有 可 能 会 存在 一 些 我 们 尚未 发 现 的 更 小 的 
群体 ， 比 如 公布 食物 热量 信息 只 对 那些 已 经 在 计算 食物 热量 的 人 群 有 效 。 
在 这 种 情况 下 ,如 果 我 们 把 所 有 人 的 数据 结合 在 一 起 来 分 析 , 那么 事物 之 
间 的 联系 可 能 就 显得 微不足道 了 。 

我 们 还 讨论 过 很 多 这 样 的 情况 : 事物 之 间 可 能 会 出 现 很 强 的 相关 性 ， 
却 不 存在 相应 的 因果 关系 。 唐 氏 综合 征 和 出 生 顺 序 就 是 这 样 一 个 例子 。 出 
生 顺 序 可 以 向 我 们 透露 母亲 生育 孩子 时 的 年 龄 ( 生 第 四 个 孩子 的 母亲 平均 
要 比 生 第 一 个 孩子 的 母亲 的 年 龄 更 大 ), 因此 出 生 顺 序 和 唐 氏 综合 征 之 间 
有 着 很 强 的 相关 性 ， 但 它 却 不 是 导致 唐 氏 综合 征 的 原因 。 “相关 性 的 强度 
是 否 能 够 有 力 证 明 事物 之 间 存 在 因果 关系 , 这 要 看 我 们 是 否 解释 了 这 些 可 
能 的 共同 原因 ， 以 及 这 些 共 同 原因 是 否 能 够 解释 各 种 结果 之 间 的 联系 。” 

当 我 们 看 到 事物 之 间 存 在 很 强 的 相关 性 时 ， 我 们 需要 考虑 的 问题 有 : 
这 种 关系 是 不 对 称 的 吗 ( 为 什么 我 们 会 认为 其 中 一 个 事物 是 原因 而 另 一 个 
事物 是 结果 呢 )? 这 种 相关 性 是 否 是 这 两 个 事物 之 间 的 一 个 共同 原因 导致 
的 ? 这 种 相关 性 是 否 是 方法 问题 ( 范围 限制 .选择 性 偏差 和 失误 ) 导 致 的 ? 
我 们 是 否 忽略 了 其 他 与 结果 密切 相关 的 因素 ?对 于 那些 时 间 序 列 数据 来 
说 , 这 种 相关 性 是 否 是 两 个 事物 都 是 非 稳定 变量 导致 的 ( 也 许 这 两 个 事物 
都 随 着 时 间 的 变化 而 呈现 出 一 种 相似 的 上 升 趋势 ) ? 


9.1.2 一 致 性 “可 重复 性 ) 


如 果 公 布 食 物 热量 信息 确实 可 以 降低 人 们 摄 入 的 热量 值 ， 那 么 不 同 
的 研究 人 员 通 过 不 同 的 方法 应 该 可 以 重复 获得 这 一 发 现 , 而 且 这 一 发 现 应 
该 在 多 家 餐厅 都 适用 。 虽 然 这 与 Hume 和 Mackie 理论 中 的 规律 性 并 不 是 
同一 个 概念 , 但 两 者 的 思路 是 一 样 的 一 一 真正 的 因果 关系 不 应 该 只 能 在 一 
个 试验 中 观察 到 , 而 应 该 在 很 多 试验 中 都 能 观察 到 .我 们 在 第 7 章 讨论 过 ， 
出 于 很 多 原因 ， 有 些 发 现 可 能 是 无 法 复制 的 。 但 是 ,针对 很 多 城市 的 不 同 
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人 和 群 ,不 同 的 研究 人 员 使 用 不 同 的 方法 对 公布 食物 热量 信 ， 
研究 , 然后 发 现 公 布 食物 热量 信息 并 未 降低 人 
多 的 研究 让 这 一 发 现成 为 偶然 性 事件 的 概率 大 
中 , 我们 所 引进 的 变 


加 肯定 的 结论 。 
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们 在 几 家 咖啡 店 点 的 食物 的 热量 值 有 所 下 降 。 


我 们 也 可 以 
系 。 有 很 多 论文 研究 了 哪些 食物 1 
些 食物 似乎 可 以 降低 这 些 风 险 。 通 过 分 析 这 些 论文 , 我 们 发 现 几乎 每 一 种 
食物 都 有 能 够 增加 或 降低 人 们 患 癌症 的 风 





























所 引用 的 研究 





























以 乎 可 以 4 
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险 的 证 据 。* 人 们 可 能 会 从 他 们 
! 挑 出 那些 支持 自己 想法 的 有 力 证 据 ,但 在 考察 这 些 研究 的 


所 有 证 据 后 , 我 们 发 现 这 些 证 据 并 不 是 那么 确凿 。 同 理 , 由 


很 多 假设 (所 以 某 个 假设 可 能 由 于 巧合 而 具有 了 显著 性 ) 所 导致 的 假 阳性 





结论 也 是 不 可 3 





当 我 们 的 发 ] 








E 复 的 。 
钢 不 具有 一 致 性 时 ， 又 能 得 出 什么 样 的 结论 呢 ? 有 可 能 





让 某 个 原因 起 作 














息 的 影响 进行 了 
门 点 的 食物 的 热量 值 。 这 么 
大 降低 ,在 重复 试验 的 过 程 
会 很 自然 地 导致 我 们 对 事物 之 间 关系 的 强度 得 出 更 
然而 , 我 们 在 某 一 个 城市 发 现 公 布 食 物 的 热量 信息 导致 人 


























用 结论 的 不 一 致 性 来 排除 一 些 表 面 上 很 密切 的 因果 关 
兽 加 入 们 患 癌症 的 风险 , 以 及 哪 














于 一 次 性 检测 























| 的 关键 因素 在 一 个 试验 





没有 出 现 。 比 如 说 , BURA INF OFA HEATHER, A 


蚊子 才 会 传播 症 疾 。 如 果 我 们 不 知道 起 作用 的 关键 因素 是 什么 , 那么 结果 

















出 现 了 ,但 在 男 一 个 试验 中 却 


有 感染 症 疾 的 








似乎 就 变 得 无 法 预测 了 。 值得 注意 的 是 , 研究 结论 不 一 致 并 不 等 于 原因 本 





身 不 一 致 。 正 如 六 





E 疾 的 案例 一 样 ,可 能 是 








问题 上 存在 差异 ， 所 以 导致 了 研究 
在 所 有 研究 














的 。 如 果 每 一 项 研究 都 只 记录 了 出 4 
的 年 龄 实际 上 能 够 准确 地 反映 出 生 | 


结论 






































IF , 那么 


虽然 出 生 顺 序 


1 于 我 们 研究 的 群体 在 一 些 关键 
的 不 一 致 。 
FP 都 一 致 的 发 现 也 有 可 能 是 一 个 共同 的 缺陷 或 琉 忽 导致 
E 顺 序 而 没有 记 下 产妇 的 年 龄 , 而 产妇 





和 唐 氏 综合 征 


之 间 没 有 因果 关系 ,但 两 者 之 间 的 联系 仍然 会 呈现 出 一 致 性 特征 。 同 理 ， 


有 可 能 所 有 的 研究 都 犯 了 相同 的 数学 错误 或 者 者 











使 用 了 同样 被 污染 的 样本 。 
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在 评估 某 个 关系 的 一 致 性 时 , 我 们 需要 考虑 的 问题 包括 “: 我 们 是 否 





准确 复制 了 那些 研究 方法 ?研究 的 目的 是 再 现 主 要 结果 吗 ? 如 果 我 们 未 
































能 成 功 复制 一 项 研究 , 这 是 否 可 能 是 研究 群体 或 研究 方法 的 显著 变化 造成 











的 ? 在 不 同 的 研究 中 , 结果 的 大 小 是 一 致 的 吗 ? 这些 





E 研 究 都 有 足够 的 动力 








可 以 让 我 们 发 现 某 个 原因 导致 的 结果 吗 ? 这些 研 究 是 彼此 独立 的 吗 ( 或 者 
资金 来 源 是 否 相同 ， 比 如 一 家 制药 公司 同时 资助 两 项 研究 ) ? 








9.1.3 ”特异 性 











如 果 有 人 说 单独 服用 某 一 种 药品 能 够 治 好 癌症 、 普 通 感冒 和 症 疾 ， 
我 们 肯定 会 认为 这 种 说 法 十 分 不 可 信 。 但 是 , 我 们 却 知道 吸烟 会 在 不 同 程 








度 上 导致 很 多 健康 问题 。 























特异 性 指 的 不 仅仅 是 一 个 原因 导致 的 各 种 结果 之 间 的 差异 ， 还 包括 
这 个 原因 对 每 一 个 结果 的 影响 程度 。 这 并 不 意味 着 一 个 原因 只 能 导致 一 种 















































结果 (这 也 不 大 可 能 )， 而 是 意味 着 与 一 个 似乎 对 每 种 结果 都 会 产生 重要 


EL 














影响 的 原因 相 比 ， 一 个 更 加 具体 的 关系 可 能 会 为 我 们 提供 更 加 强 有 力 的 














证 据 。 比 如 说 , 某 种 药物 可 能 无 法 完全 治愈 很 多 不 同 的 疾病 , 但 它 却 可 能 




















对 某 一 种 疾病 产生 主要 效果 ， 而 对 其 他 疾病 产生 次 要 效果 。 同 理 ， 如 果 
有 人 说 骑 行 可 以 减少 各 种 原因 导致 的 死亡 事件 ,那么 这 种 说 法 似乎 也 是 令 
人 难以 置信 的 。 然 而 ， 如 果 我 们 说 骑 行 对 于 健康 的 主要 作用 是 可 以 减少 


























肥胖 症 患 者 的 数量 以 及 心血 管 疾病 导致 的 死亡 事件 
可 信 了 。 
从 某 种 意义 上 来 说 ,特异 性 还 意味 着 我 们 推 开 











,那么 这 种 说 法 就 比较 


出 的 关系 到 底 有 多 直 








接 。 在 特异 性 的 一 端 , 我 们 可 能 会 看 到 粒度 非常 细 的 关系 ， 比 如 说 我 们 发 














现 周三 早上 发 出 的 竞选 募捐 邮件 与 周 六 晚上 发 出 的 竞选 募捐 邮件 相 比 , 能 
从 收 件 人 那里 筹集 到 更 多 、 额 度 更 大 的 捐款 。 而 在 特异 性 的 另 一 端 ,我们 




















可 能 只 会 发 现 筹集 到 更 多 资金 与 候选 人 发 邮件 有 关 
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特异 性 往往 取决 于 我 们 的 认 知 程度 。 如 果 我 们 对 某 个 原因 的 作用 机 

制 以 及 它 的 主要 影响 一 无 所 知 , 那么 我 们 得 到 的 可 能 只 是 ( 反映 事物 间 关 
系 的 ) 非常 间接 的 证 据 ( 比如 只 考察 吸烟 者 的 死亡 率 与 肺癌 发 病 率 及 死亡 
K) 虽然 特异 性 并 不 是 必要 条 件 , 但 与 事物 之 间 的 间接 关系 相 比 ， 人 们 
可 能 更 容易 接受 事物 之 间 更 加 密切 的 直接 关系 。 不 过 , 人 们 一 般 认 为 特异 
性 是 一 个 相对 来 说 不 太 重要 的 标准 之 一 。” 
至 于 有 没有 可 能 产生 多 重 效应 ， 这 要 取决 于 我 们 假设 的 关系 的 运行 
机 制 。 假 如 我 们 认为 因为 自行 车 头盔 能 够 降低 骑 行 者 头 部 受伤 的 概率 , 所 
以 头盔 对 骑 行 者 具有 保护 作用 。 这 种 情况 下 ,如 果 我 们 说 戴 头 套 能 减少 骑 
行者 各 种 类 型 的 受伤 事件 ,或 者 戴 头盔 能 减少 骑 行 者 中 头 部 受伤 的 事件 ， 
而 对 其 他 类 型 的 受伤 事件 影响 极 小 , 两 者 相 比 , 后 者 能 够 更 加 有 力 地 证 明 
头盔 对 骑 行 者 的 保护 作用 。 这 是 因为 总 的 受伤 事件 的 减少 可 能 是 因为 戴 头 
盔 的 骑 行 者 骑 车 更 为 并 慎 或 更 有 经 验 , 而 这 些 人 与 不 戴 头 睁 的 人 相 比 , 受 
伤 的 可 能 性 本 来 就 更 低 。” 

因此 ， 在 考虑 特异 性 的 过 程 中 ， 我 们 还 必须 考虑 事物 之 间 联 系 的 强 
度 以 及 我 们 的 先 验 知识 : 这 个 原因 会 导致 不 同 的 结果 吗 ? 它 对 各 种 结果 的 
影响 程度 是 一 致 的 吗 ? 这 个 原因 对 结果 的 影响 程度 与 我 们 预期 的 影响 程 


度 是 否 有 差别 ? 




















































































































9.1.4 时 间 性 


是 青少年 的 怀孕 率 下 降 导 致 观看 反映 青少年 怀孕 问题 的 电视 节目 的 
人 数 增加 , 还 是 观看 这 种 电视 节目 的 人 数 增加 导致 青少年 的 怀孕 率 下 降 ? 
我 们 在 第 4 章 讨论 过 ， 事 件 发 生 的 顺序 也 是 寻找 因果 关系 的 一 个 重要 线 
索 。 但 有 时 我 们 并 不 知道 哪个 在 前 、 哪 个 在 后 : 是 一 通电 话 改变 了 选民 们 
的 投票 偏向 , 还 是 因为 针对 选民 的 人 口 统计 学 数据 的 分 析 预 测 到 了 这 些 选 
民 的 偏向 ,所 以 他 们 的 名 字 才 会 出 现在 需要 打 电 话 游说 的 选民 名 单 中 ? 理 
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清 事件 发 生 的 顺序 是 弄 清 因 有 








果 关 系 简 易 入 门 


关系 真实 方向 的 关键 。 





比如 说 ， 某 种 疾病 的 早期 症状 可 能 会 出 现在 这 个 疾病 被 确诊 之 前 ， 
但 实际 上 是 这 种 疾病 引起 了 这 些 症状 。 在 随机 试验 中 , 干预 措施 和 干预 结 
我 们 可 以 从 观察 性 时 间 序 列 数据 中 发 现 这 种 顺序 ( 假 
设 测量 的 频率 足够 高 ， 这 样 如 果 A 出 现在 B 之 前 的 话 ， 那 么 这 两 件 事 就 
一 定 会 先后 按 顺 序 被 观察 到 ) 但 有 些 研 究 使 用 的 是 一 次 性 案例 ， 这 些 研 
究 在 面 对 这 个 问题 时 可 能 会 遇 到 一 些 麻烦 。 这 些 横 断面 研究 就 像 是 给 研究 


果 的 顺序 是 清晰 的 ， 











群体 拍 了 个 快照 , 比如 调查 人 们 的 
































居住 地 址 以 及 有 什么 过 敏 问题 等 ,但 是 ， 


这 样 的 研究 只 能 告诉 我 们 某 一 次 出 现 了 什么 情况 , 我 们 无 法 知道 这 些 人 在 











新 的 环境 导致 的 。 





股 到 某 个 特定 的 地 方 之 前 有 没有 过 敏 史 , 也 不 知道 他 们 的 过 敏 问 题 是 否 是 


尽管 时 间 上 的 优先 性 意味 着 原因 会 在 结果 之 前 出 现 ， 但 我 们 也 必须 
考虑 原因 和 结果 之 间隔 了 多 长 时 间 。 我 们 是 否 会 相信 和 原因 和 结果 之 间 会 出 


现 一 个 很 长 的 时 间 间 隔 , 这 取决 于 我 们 








进入 一 个 很 陡峭 的 


能 性 更 大 。 只 有 当 他 们 






































已 经 掌握 的 信息 。 如 果 你 看 到 有 人 


时 闭 式 滑 道 , 你 一 定 会 认为 他 出 现在 滑 道 底 部 的 速度 比 
在 平缓 一 些 的 滑 道中 要 快 得 多 。 所 以 ,在 第 一 种 情况 下， 耽搁 很 长 时 间 是 
不 太 可 能 的 ; 而 在 第 二 种 情况 下 ， 耽 搁 的 时 间 很 短 也 是 不 太 可 能 的 。 我 们 
在 第 4 章 心 理学 研究 中 已 经 见识 过 这 一 点 了 。 在 第 4 章 的 一 个 实验 中 , 当 
原因 和 结果 之 间 的 时 间 间 隔 很 短 时 , 参与 者 们 认为 存在 某 种 因果 关系 的 可 

















才 会 在 原因 和 结果 之 间 的 时 
很 难 相信 在 接触 石棉 和 患 上 上] 
有 可 能 会 在 看 到 食物 热量 信 ， 























即使 原因 确实 发 生 在 结果 之 








前 ， 它 


























知道 其 中 的 作用 机 制 需要 更 长 的 运行 时 间 时 , 他 们 
间 间 隔 较 长 时 也 认为 存在 某 种 因果 关系 。 人们 
席 症 之 间 只 有 儿 分 钟 的 时 间 间 隔 , 但 人 们 却 很 
息 后 的 几 分钟 内 就 改变 他 们 所 点 的 食物 。 



































也 不 一 定 是 当时 唯一 发 生 的 事 。 如 
































果 公 布 食物 热量 信息 和 和 餐厅 对 菜 


单 进行 











巨大 改动 这 两 件 事 同 时 发 生 , 那 我 


们 就 无 法 确定 让 顾客 改变 行为 的 是 哪 一 件 事 。 比 如 说 , 有 些 研究 曾经 认为 


一 个 人 的 小 学 老师 会 对 这 个 人 几 十 年 后 的 工资 产生 影响 。” 为 了 证 明 这 是 
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可 信 的 , 我们 必须 找到 一 个 原因 来 解释 在 这 几 十 年 中 存在 一 个 从 童年 就 一 
直 延 续 下 来 的 影响 ( 最 终 导致 了 一 些 与 工资 有 关 的 其 他 事件 链 )， 而 且 这 
个 影响 没有 被 某 个 共同 的 原因 混淆 ， 也 不 是 一 些 其 他 的 中 间 原 因 导 致 的 。 





















































无 论 我 们 是 否 看 到 原因 出 现在 结果 之 前 ， 都 必须 考虑 一 些 问题 ， 这 
些 事 件 之 间 的 表面 顺序 是 正确 的 吗 ? 这 是 否 是 一 个 由 数据 收集 方式 或 失 








误导 致 的 人 为 结果 ?考虑 到 原因 的 运行 机 制 , 这 种 时 间 间 隔 合理 吗 ? 在 假 
设 的 原因 出 现 之 后 存在 一 个 很 长 的 时 间 间 隔 , 那么 这 个 结果 有 没有 可 能 是 




















其 他 因素 的 干预 导致 的 ? 反之, 在 有 可 能 导 
有 没有 其 他 几乎 在 同一 时 间 发 生 的 事件 呢 ? 


9.1.5 生物 梯度 














致 结果 的 原因 出 现 的 时 候 , 还 








是 不 是 越 多 的 原因 就 会 导致 越 多 的 结果 呢 ? 这 正 是 Mill 的 共 变 法 研 
究 的 问题 。 随 着 原因 的 剂量 增加 ， 它 引起 的 反应 也 应 该 增加 。” 随 着 工人 



























































门 在 被 石棉 污染 的 环境 中 待 的 时 间 越 长 、 与 石棉 的 接触 越 多 , 他 们 患 上 疾 
病 的 风险 也 应 该 越 大 。 相 反 ， 人 的 身体 对 葡萄 酒 的 反应 就 不 会 那么 敏感 ， 
稍微 多 喝 一 点 或 者 少 喝 一 点 不 会 有 太 大 的 差别 ， 所 以 ,“ 每 天 喝 正 好 一 杯 
衣 萄 酒 才 是 唯一 对 身体 有 益 的 饮用 量 ”似乎 不 太 可 信 。 "剂量 ”也 有 可 能 

















是 建立 在 距离 基础 之 上 的 ， 比 如 在 Snow 发 现 霍 乱 原因 的 案例 中 ， 伦 敦 居 
民居 住 的 地 方 距离 被 污染 水 泵 的 远近 。” 如 果 说 在 一 个 巨大 的 半径 范围 内 ， 
所 有 人 得 霍乱 的 风险 都 是 完全 一 样 的 ， 或 者 随 着 人 们 距 被 污染 水 泵 越 远 ， 

患 上 霍乱 的 风险 就 越 小 , 二 者 相 比 , 第 一 种 说 法 作为 证 据 的 说 服 力 显然 要 




















小 得 多 。 











此 外 ， 如 果 一 个 人 接触 原因 的 情况 发 生 了 变化 〈 比如 停止 服用 某 种 
药物 、 歹 烟 或 者 减少 钠 的 摄 人 量 )， 那 么 那些 由 于 接触 导致 的 副作用 、 患 净 
症 的 风险 以 及 高 血压 也 应 该 会 发 生变 化 一 一 假设 这 种 影响 不 是 永久 不 变 的 。 
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果 关 系 简 易 入 门 








不 过 , Mill 的 方法 需要 注意 的 问题 在 这 儿 也 同样 需要 注意 。 比 如 那个 
西 精 和 心脏 疾病 的 案例 ， 当 酒精 摄 入 量 很 高 或 很 低 时 , 患 心 脏 病 的 风险 都 
比较 高 ; 而 摄 入 量 不 高 不 低 时 , 患 心脏 病 的 风险 会 降低 。 很 多 生物 性 关系 
都 会 呈现 这 种 J 形 曲线 (如 图 5-1 所 示 )。 在 这 种 曲线 中 ,剂量 低 的 一 端 
风险 更 高 ， 剂 量 中 等 时 风险 下 降 ， 然 后 在 剂量 高 的 时 候 风险 又 迅速 回升 。 

我 们 需要 主要 考虑 的 一 些 问 题 包 括 : 针对 不 同 的 原因 值 ， 结 果 的 量 
(或 出 现 的 可 能 性 ) 会 发 生 怎样 的 改变 ”如 果 我 们 能 够 控制 一 个 人 与 原 
因 的 接触 ， 这 是 否 能 够 改变 那个 人 所 面临 的 风险 程度 ? 或 者 是 否 能 够 改 
变 原因 所 导致 的 各 种 结果 ? 我 们 对 剂量 的 测量 到 底 有 多 精确 ? 


一 < 






















































































9.1.6 ”可 信和 度 与 连贯 性 


根据 我 们 当下 掌握 的 知识 ， 是 否 可 能 存在 一 种 能 将 原因 和 结果 连接 
在 一 起 的 机 制 ? ”如 果 我 们 提出 咖啡 饮用 过 量 会 导致 人 们 英 年 早 逝 , 在 这 
种 情况 下 , 如 果 我 们 知道 这 种 结果 是 如 何 出 现 的 ,而 且 我 们 的 解释 与 当下 
人 们 对 生物 学 的 理解 是 一 致 的 , 那么 这 种 说 法 将 会 更 为 可 信 。 如 果 太 多 的 
咖啡 因 会 让 人 们 紧张 不 安 并 且 降 低 他 们 对 正在 执行 的 任务 的 意识 , 那么 他 
们 就 很 可 能 会 陷入 更 多 的 事故 之 中 。 相 反 , 如 果 我 们 提出 总 统 穿 暖 色 衣服 
时 股市 就 会 上 涨 , 穿 冷 色 衣服 时 股票 价格 就 会 急剧 下 跌 , 那 这 就 需要 我 们 
从 了 解 的 股票 知识 跨越 一 个 巨大 的 鸿沟 到 新 的 结论 。 
1 于 我 们 的 认 知 可 能 是 错误 的 ， 而 且 可 能 并 不 知道 一 个 新 原因 的 作 
原理 是 什么 ， 所 以 Hill 认为 可 信 度 并 不 是 必 不 可 少 的 东西 。 然 而 ， 我 们 
要 有 一 个 通过 原因 产生 结果 的 假设 机 制 ， 而 且 其 他 研究 人 员 已 经 强调 过 这 
种 假设 机 制 的 重要 性 了 。” 我 们 可 能 最 终 并 不 需要 这 种 证 据 ， 但 它 却 能 让 
我 们 对 自己 的 发 现 更 加 自信 。 关系 越 古怪 , 我 们 就 越 需要 这 种 信息 作为 文 撑 。 

根据 我 们 当下 掌握 的 知识 ， 这 种 可 能 存在 的 关系 具有 连贯 性 吗 ? 这 
个 关系 和 我 们 通常 认可 的 事实 是 否 矛 盾 ? 它 和 我 们 的 认 知 一 致 吗 ” 由 于 
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我 们 的 知识 也 可 能 是 错误 的 ， 所 以 这 并 不 是 一 个 无 法 跨越 的 障碍 。 然 而 ， 
如 果 一 个 可 能 存在 的 因果 关系 和 我 们 掌握 的 物理 学 知识 矛盾 〈 包括 万 有 
引力 )， 那 么 我 们 就 需要 三 思 而 后 行 了 。” 

要 注意 连贯 性 和 可 信 度 之 间 的 差别 。 可 信和 度 指 的 是 根据 我 们 掌握 的 
知识 , 我 们 能 够 想到 某 种 方式 来 让 我 们 研究 的 因果 关系 得 以 出 现 。 但 对 于 
连贯 性 来 说 , 我 们 可 能 对 原因 导致 结果 的 方式 一 无 所 知 , 但 当 原 因 和 结果 
联系 在 一 起 时 ， 却 与 我 们 的 认 知 并 不 矛盾 。 当 Snow 第 一 次 发 现 被 污染 水 
泵 和 零乱 之 间 存 在 联系 时 , 人 们 根本 不 会 想到 导致 霍乱 暴发 的 竟然 是 被 污 
染 水 体 中 那些 微小 的 细菌 。 当 时 人 们 都 认为 霍乱 是 被 污染 的 空气 导致 的 ， 
Snow 的 发 现 与 人 们 的 认识 格格 不 入 。 随 着 时 间 的 变化 , 我 们 掌握 的 知识 也 
会 发 生变 化 ， 因 此 我 们 对 于 “什么 是 连贯 的 ”“ 什 么 是 可 能 的 ”的 看 法 也 
会 发 生变 化 。 

所 以 ， 当 我 们 评估 某 种 关系 是 否 可 信 或 者 是 否 连贯 时 ， 也 必须 评 佑 
自己 已 有 的 认 知 。 如 果 这 种 新 的 关系 与 我 们 的 认 知 矛盾 , 我 们 又 有 多 大 把 
握 保 证 我 们 的 认 知 是 正确 的 ? 

































































































































































9.1.7 实验 





如 果 我 们 通过 干预 措施 来 引入 导致 结果 出 现 的 原因 或 者 提高 原因 出 
现 的 概率 ， 那 结果 会 出 现 吗 ? 这 个 因素 和 其 他 因素 之 间 最 大 的 差别 在 于 ， 
它 要 求 我 们 积极 地 操控 某 个 事物 ， 而 其 他 因素 则 完全 可 以 通过 观察 得 到 。 
然而 ,实验 也 不 一 定 非 要 是 在 人 身上 进行 的 随机 对 照 实 验 ,在 有 些 情 况 下 ， 
这 样 的 随机 对 照 实 验 也 许 是 不 可 能 的 、 不 可 行 的 或 者 需要 的 时 间 太 长 以 致 
我 们 无 法 得 出 结论 , 所 以 实验 结论 也 可 能 来 自 于 体外 研究 或 者 在 动物 身上 
进行 的 实验 ,虽然 我 们 从 未 做 过 强迫 人 们 去 吸烟 的 实验 ,但 是 有 实验 表明 ， 
将 焦油 涂 在 动物 耳 条 上 会 导致 那个 部 位 发 生 癌变 , 这 就 为 我 们 提供 了 辅助 
性 证 据 , 证 明 烟 草 中 的 某 种 成 分 有 可 能 是 致癌 物质 。 实 验 研究 让 我 们 能 够 
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切断 引起 我 们 采取 干预 措施 的 事物 和 其 带 来 的 结果 之 间 的 联系 。 因此 , 如 
果 在 一 个 虚假 的 原因 和 结果 之 间 存 在 一 个 共同 的 原因 , 那么 对 虚假 原因 的 
操纵 将 不 会 对 结果 产生 任何 影响 。 

我 们 在 第 7 章 已 经 讨论 过 很 多 原因 ,它们 既 有 可 能 让 我 们 在 实验 中 无 
法 找到 真正 的 因果 关系 〈 比 如 在 样本 规模 太 小 的 情况 下 )， 也 有 可 能 让 我 
们 找到 的 原因 是 一 个 虚假 的 原因 〈 比如 在 非 育 随机 试验 中 )。 在 以 动物 为 
实验 对 象 的 研究 中 , 即使 研究 结论 是 阳性 的 , 我 们 也 必须 仔细 考量 手中 的 
证 据 , 以 便 保证 实验 研究 的 原因 在 我 们 研究 的 系统 中 与 在 人 群 中 的 表现 是 
一 致 的 。 比 如 我 们 以 老鼠 为 研究 对 象 , 发 现 了 一 些 治疗 败血症 的 方法 。 这 
些 治疗 方法 本 来 在 人 身上 也 应 该 起 作用 ， 但 是 我 们 却 没有 发 现 这 样 的 证 
据 。 结 果 就 有 人 提出 质疑 : 在 研究 人 类 的 各 种 炎症 类 疾病 时 ,用 老鼠 作为 
实验 对 象 是 不 是 一 个 好 的 选择 ? °° 
当 我 们 不 在 人 身上 做 实验 或 者 在 活体 以 外 的 环境 中 做 实验 时 ， 必 须要 
确定 所 用 的 替代 品 是 否 能 够 反映 某 个 原因 在 人 体 中 起 作用 的 方式 。 


9.1.8 ”类 比 性 


最 后 ， 如 果 我 们 了 解 到 有 一 个 相似 的 因果 关系 ， 那 就 可 以 相应 降低 
对 证 据 的 要 求 , 因为 这 个 相似 的 因果 关系 已 经 证 明了 某 个 原因 是 有 可 能 导 
致 我 们 想 要 证 明 的 结果 的 。 假设 我 们 了 解 到 , 如 果 和 餐厅 标 出 食物 的 脂肪 含 
量 数据 , 那么 顾客 点 的 食物 的 脂肪 含量 就 会 下 降 。 由 于 我 们 已 经 知道 公布 
食物 的 营养 数据 有 可 能 会 改变 人 们 的 行为 , 所 以 我 们 就 更 有 可 能 会 相信 公 
布 食物 的 热量 信息 有 可 能 改变 人 们 的 行为 。 再 打 个 比方 , 在 我 们 知道 乳头 
瘤 病 毒 会 导致 一 些 子宫 瘤 之 后 , 我 们 会 发 现 一 种 病毒 能 够 导致 不 同 癌症 的 
说 法 更 加 可 信 了 。 类 比 还 意味 着 可 以 利用 关于 动物 的 研究 来 更 好 地 了 解 人 
类 ， 或 者 可 以 将 不 同 规模 的 各 种 系统 连接 在 一 起 。 
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我 们 必须 要 评估 一 个 实验 的 装置 与 我 们 想 要 研究 的 系统 之 间 到 底 有 
多 接近 , 也 必须 要 审查 我 们 手头 到 底 有 多 少 证 据 能 够 证 明 我 们 从 一 个 环境 
中 了 解 到 的 信息 能 够 应 用 于 男 一 个 环境 之 中 。 

记 住 ,没有 任何 一 个 清单 可 以 确定 事物 之 间 的 因果 关系 ， 也 没有 任 
何 一 个 必须 满足 的 或 者 始终 能 够 满足 的 因果 关系 标准 。 上 面 分 析 的 各 种 因 
素 只 是 将 概率 法 、 机 械 法 、 干 预 法 和 实验 法 等 方法 结合 在 了 一 起 , 形成 了 
一 组 需要 考虑 的 因素 。 在 每 个 案例 中 ,我 们 都 必须 考虑 信息 本 身 的 质量 。 
随机 实验 的 信息 质量 可 能 很 糟糕 , 事物 之 间 的 相关 性 可 能 是 选择 性 偏差 导 
致 的 结果 , 而 用 动物 做 实验 对 象 的 研究 结果 可 能 并 不 适用 于 某 种 特定 的 疾 
病 。 同 理 , 证 据 的 标准 也 取决 于 这 个 证 据 要 支持 的 观点 到 底 是 什么 , 以 及 
j 此 导致 的 行为 的 潜在 风险 和 成 本 。 哲 学 家 们 曾经 提出 过 一 些 关 于 证 据 的 
理论 , 试图 描述 某 个 事物 作为 一 个 科学 假设 的 证 据 到 底 意 味 着 什么 。 但 一 
股 来 说 , 这 些 理论 和 科学 家 们 实际 使 用 和 看 待 证据 的 方式 大 不 相同 ,而 且 
这 些 理论 往往 忽略 了 使 用 证 据 时 的 背景 所 起 的 作用 。” 

比如 说 ， 谋 杀 案 的 证 据 标准 就 比 究 竞 是 哪个 小 孩 打 碎 了 花瓶 的 证 据 
标准 要 高 得 多 。 因 为 在 第 一 个 案例 中 , 发 生 移 假 错案 的 后 果 要 比 第 二 个 案 
例 严 重 得 多 。 有 一 个 很 弱 的 证 据 表明 , 每 天 吃 一 块 巧克力 可 以 改善 人 们 的 
心情 。 这 样 的 证 据 对 于 一 个 人 决定 坚持 吃 巧克力 可 能 是 足够 的 , 但 是 却 不 
足以 让 我 们 制定 一 个 建议 人 们 每 天 都 要 吃 巧克力 的 国家 营养 标准 。 
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9.2 ”根据 原因 制定 政策 


将 苏打 水 的 瓶子 变 小 、 在 连锁 餐厅 的 菜单 上 公布 食物 的 热量 值 、 禁 
用 反 式 脂肪 以 及 降低 餐厅 食物 的 含 钠 量 等 , 这 些 只 不 过 是 纽约 市 为 了 改善 
纽约 人 口 的 健康 状况 曾 考虑 或 实施 过 的 部 分 政策 。 

如 果 我 们 知道 糖 、 高 热量 食物 、 反 式 脂肪 和 钠 与 我 们 想 要 改善 的 各 
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种 健康 问题 之 间 存 在 因果 关系 , 那么 我 们 能 预先 知道 纽约 市 的 上 述 行为 是 
和 否 会 取得 成 功 吗 ? 要 想 理解 这 个 问题 , 我 们 需要 知道 一 项 干预 措施 的 影响 
是 什么 , 以 及 如 何在 各 种 可 能 的 干预 措施 中 做 出 选择 。 然 而 , 一 种 行为 导 
致 的 影响 不 一 定 仅仅 是 我 们 能 够 想到 的 结果 。 一 个 原因 可 能 会 导致 多 种 结 
果 , 更 令 人 头疼 的 是 , 干预 行为 本 身 可 能 也 会 导致 事物 之 间 的 因果 关系 发 
生 改 变 。 某 种 降低 胆固醇 的 药物 可 能 在 一 个 人 身上 的 效果 非常 好 , 但 在 另 
一 个 人 身上 却 完全 无 效 。 这 是 因为 另 一 个 人 认为 这 种 药物 无 论 怎样 都 能 帮 
他 控制 胆固醇 ,所 以 他 就 选择 了 对 身体 更 加 有 害 的 食谱 。 在 另 一 个 案例 中 ， 
如 果 标 准 化 测试 成 绩 一 开始 和 教学 质量 紧密 相连 , 但 人 们 用 考试 成 绩 来 评 
价 老师 ,那么 标准 化 测试 成 绩 和 教学 质量 之 间 的 联系 就 可 能 会 变 弱 。 
为 在 这 种 情况 下 ， 老 师 会 把 他 们 的 教学 中 心 完 全 放 在 为 学 生 备考 上 。™ 
尽管 如 此 ， 我 们 仍然 想 把 决策 建立 在 证 据 之 上 ， 而 不 是 建立 在 传闻 
轶 事 之 上 。 而 且 , 证 据 也 应 该 建立 在 因果 关系 之 上 ,而 不 是 建立 在 相关 性 
之 上 。 现在 出 现 了 以 证 据 为 依据 的 医学 、 设 计 、 教 育 以 及 很 多 其 他 运动 来 
推进 以 证 据 为 依据 的 行为 。 这 并 不 是 说 这 些 领域 以 前 不 以 证 据 为 依据 , 而 
是 说 那些 主张 采用 以 证 据 为 依据 的 研究 方法 的 人 在 试图 确定 什么 是 好 的 
证 据 。 他 们 不 再 简单 地 判断 某 个 给 定 的 假设 是 否 有 证 据 作为 支撑 , 而 是 试 
图 区 分 有 力 的 和 无 力 的 证 据 , 并 且 推 动人 们 去 使 用 更 好 的 证 据 。 这 一 切 的 
结果 通常 会 呈现 出 一 个 等 级 不 同 的 证 据 金 字 塔 体系 ,， ”而 RCT ( 或 者 更 具 
体 地 说 , 是 对 多 个 RCT 的 系统 性 综述 ) 无 一 例外 地 会 出 现在 这 个 金字 塔 的 
顶部 。 然 而 ， 这 些 等 级 体系 并 不 一 定 会 告诉 我 们 什么 样 的 信息 是 必要 的 ， 
以 及 如 何 去 使 用 这 样 的 信息 。 从 理论 上 来 说 ， 一 个 完美 的 RCT 可 能 是 最 
好 的 证 据 , 但 在 现实 生活 中 , 我 们 对 比 的 并 不 是 一 个 完美 的 实验 和 一 项 观 
察 性 研究 。 相反 , 我 们 可 能 会 面 对 一 个 规模 很 小 且 带 有 偏差 的 随机 试验 研 
究 和 一 个 规模 很 大 又 很 完美 的 观察 性 研究 , 这 两 者 给 出 的 证 据 还 是 相互 矛 
盾 的 , 或 者 我 们 只 掌握 了 一 些 非 实 证 性 证 据 。 在 实践 中 , 我 们 不 得 不 依据 
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这 样 的 信息 来 采取 行动 。 所以, 知道 如 何以 更 好 地 方式 来 应 对 这 种 情况 对 


我 们 来 说 至 关 重 要 。 





我 们 将 考察 各 种 因素 来 决定 什么 时 候 实施 某 项 政策 以 及 如 何 得 出 一 
般 性 结论 。 这 里 所 说 的 “政策 ”或 “干预 措施 ”可 能 是 一 项 禁止 在 全 市 范 























围 内 的 公共 场所 吸烟 以 改善 市 民 健康 状况 的 政策 , 也 可 能 是 美联储 调整 利 
率 以 刺激 经 济 活动 的 政策 , 还 可 能 只 是 一 个 让 你 不 要 在 下 午 四 点 之 后 喝 咖 
啡 以 便 减 轻 失眠 症状 的 要 求 。 在 所 有 这 些 情况 中 , 我 们 都 引入 了 一 种 变化 

















以 便 实现 某 个 特定 的 目的 。 在 某 些 情况 





1, 我 们 的 证 据 可 能 是 在 一 个 地 方 





实施 的 一 项 政策 ( 比如 在 纽约 市 要 求 餐 








了 公布 食物 所 含 热量 的 政策 )， 而 





我 们 想 在 男 一 个 地 方 实施 同 样 的 政策 ， 以 便 实现 同样 的 目的 。 














纽约 、 伦 敦 和 巴黎 等 城市 都 曾 实施 过 公共 自行 车 项 目 。 用 户 可 以 在 
一 个 地 方 取 用 一 辆 自行 车 , 然后 在 靠近 目的 地 的 地 方 归还 这 辆 自行 车 。 这 
个 项 目 试图 减少 人 们 乘坐 汽车 出 行 的 次 数 , 并 且 通 过 促进 人们 从 事 更 多 的 




















体力 活动 来 改善 人 们 的 健康 状况 。” 这 个 项 目 色 
以 下 儿 个 假设 : (1) 骑 自 行车 是 一 种 有 效 的 锻炼 
人 们 骑 自 行车 的 次 数 ( 而 不 只 是 让 人 们 放弃 骑 自 
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实现 其 预 设 目 标 取决 于 
式 ; (2) 这 个 项 目 会 增加 
的 自行 车 而 改 骑 公 共 自 
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行车 ) 但 是 ,我们 如 何 才能 知道 这 些 假 设 是 否 合理 ? 如 果 我 们 试图 在 另 
一 个 城市 实施 公共 自行 车 项 目 ， 又 会 出 现 什么 样 的 情况 ? 

我 们 可 以 利用 第 6 章 讲 过 的 模型 来 预测 实施 干预 措施 的 效果 。 但 这 要 
假设 我 们 所 用 的 模型 是 完整 且 正 确 的 , 而 且 我 们 在 实验 或 者 试点 研究 中 掌 

































































握 的 信息 会 运用 到 现实 生活 中 去 。 在 那些 模型 中 , 干预 措施 曾 是 一 种 非常 
精确 的 工具 , 它 能 在 不 改变 其 他 变量 的 情况 下 , 通过 某 种 方式 来 确定 一 个 



































变量 为 真 或 为 假 ,模型 通常 只 能 在 我 们 一 次 只 操纵 一 个 变量 的 情况 下 告诉 
我 们 会 发 生 什么 样 的 情况 ， 但 在 现实 生活 中 ,我 们 的 干预 措施 会 带 来 很 
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多 变化 ， 而 且 会 市 来 这 些 模型 预测 不 到 的 结果 。 

一 旦 决定 要 推广 骑 行 运动 以 便 改 善人 们 的 健康 状况 ,我 们 就 有 很 多 
方法 可 以 实现 这 个 目标 。 我 们 可 以 赠送 自行 车 、 举 办 骑 行 培训 课程 以 及 引 
入 自行 车 共享 计划 , 等 等 。 每 一 种 干预 措施 都 可 能 会 导致 不 同 的 结果 。 甚 
至 一 旦 我 们 选 定 一 个 干预 目标 ( 比如 自行 车 共享 计划 )， 还 可 以 通过 很 多 
方式 来 实施 它 。 我 们 还 需要 考虑 很 多 因素 ， 比 如 必须 要 确定 这 个 项 目的 资 
金 由 谁 提供 、 自 行车 停 在 哪里 以 及 是 否 应 该 为 骑 行 者 提供 头盔 ( 或 要 求 骑 
行者 戴 头 盔 )， 等 等 。 因 此 ， 我 们 不 仅 是 在 试图 确定 要 使 用 哪 一 个 原因 来 
导致 某 种 结果 ， 还 是 在 试图 明确 如 何 才能 让 这 个 原因 出 现 。 
































































































































9.2.1 背景 











我 们 需要 了 解 的 首要 信息 之 一 就 是 一 项 干预 措施 发 生 的 背景 。 是 否 
只 有 在 有 了 受 保护 的 自行 车 道 的 情况 下 , 这 种 自行 车 共享 计划 才能 实现 ? 
这 个 计划 是 否 需要 一 个 足够 大 的 、 已 经 存在 的 骑 行 群体 ? 这 个 计划 是 否 只 
有 在 人 口 密度 比较 高 并 且 有 很 多 自行 车 停放 点 的 城市 才能 实施 ?第 5 章 
介绍 的 Mackie 所 用 的 方法 以 及 用 原因 组 成 的 饼 形 图 考察 了 一 组 条 件 , 一 
个 原因 要 想 引起 某 种 结果 ， 还 需要 满足 这 一 组 条 件 才 行 。 

为 了 成 功 干预 ,我 们 需要 知道 哪些 因素 能 让 一 个 原因 生效 ， 以 及 我 
们 要 实施 某 项 政策 的 地 方 已 经 具备 了 这 些 因素 ,我们 还 需要 知道 那些 有 可 
能 让 原因 无 效 的 因素 都 不 会 出 现 。 比 如 ， 由 于 某 种 新 药 的 价格 太 高 ， 病 
人 未 能 按照 要 求 的 剂量 服药 ,那么 这 种 药物 就 不 会 产生 效果 。” 如果 一 个 
城市 没有 自行 车 道 , 而 骑 行 者 又 发 现在 机 动车 道 骑 自行 车 很 不 安全 , 那么 
自行 车 共享 计划 可 能 就 不 会 被 采纳 。 比 如 , 在 华盛顿 的 哥伦比亚 特区 ,有 
研究 发 现 自行 车 共享 计划 停车 点 的 使 用 频率 和 它 是 否 靠 近 自 行车 道 存在 
HACE. ” 

了 解 背 景 可 以 帮助 我 们 预测 一 项 干预 措施 是 否 会 成 功 ， 并 且 可 以 帮 
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助 我 们 解释 为 什么 某 项 干预 措施 可 能 已 经 失败 了 。 这 里 所 说 的 背景 指 的 是 
原因 饼 形 图 中 的 其 他 原因 或 者 其 他 INUS 条 件 。 要 想 让 原因 能 够 产生 某 个 
结果 , 这些 都 是 必 不 可 少 的 因素 。 如 果 没 有 这 些 因 素 ,， 一 项 实验 研究 可 能 
在 一 个 地 方 能 够 证 明 某 个 干预 措施 是 有 效 的 , 但 在 另外 一 个 地 方 可 能 就 无 
法 证 实 了 。 

改 帐 是 预防 症 疾 的 重要 手段 , 但 蚊帐 的 使 用 也 面临 着 很 多 障碍 ， 其 
中 包括 蚊帐 的 价格 。 免费 发 放 蚊 帐 应 该 可 以 减少 症 疾 的 发 病 率 , 但 这 种 结 
果 只 有 在 人 们 按照 要 求 使 用 发 放 的 蚊帐 时 才 会 出 现 。 虽 然 大 部 分 地 区 的 人 
都 是 按 要 求 使 用 蚊帐 的 ， 但 还 有 一 些 地 区 的 人 却 把 蚊帐 用 作 捕 鱼 的 渔具 。 
凡 为 这 些 地 区 缺乏 食物 ， 所 以 与 症 疾 相 比 ， 饥 俄 是 一 个 更 迫在眉睫 的 问 
题 。” 所 以 在 实施 干预 措施 时 , 我 们 需要 有 证 据 来 证 明 这 些 蚁 帐 会 被 用 来 
解决 我 们 想 要 解决 的 问题 , 或 者 需要 有 一 个 政策 来 解决 这 些 影响 蚊帐 起 作 
用 的 因素 。” 

有 一 个 问题 是 ， 如 果 这 些 因素 没有 被 测量 到 ， 那 么 人 们 对 它们 的 存 
在 可 能 还 是 一 无 所 知 。 如 果 自 行车 道 的 存在 确实 能 够 导致 更 多 的 人 骑 自 行 
车 ( 而 不 是 将 自行 车 停车 点 设置 在 自行 车 道 旁 边 ), 那么 在 一 个 新 的 场所 ， 
如 果 我 们 不 知道 那里 有 没有 自行 车 道 , 或 者 根本 就 不 知道 自行 车 道 的 必要 
PE, 那么 这 个 公共 自行 车 项 目 在 这 个 新 的 场所 就 有 可 能 会 失败 。 


9.2.2 ”效力 和 效果 


一 项 干预 措施 完全 失败 的 情况 极为 少见 ， 但 在 现实 生活 中 发 生 的 ' 
况 (效果 ) 可 能 也 会 与 人 们 预测 的 结果 大 不 相同 ， 因 为 这 些 预测 结果 都 
根据 理想 化 设置 推理 出 来 的 (效力 )。” 效 果 和 效力 的 差别 在 医学 上 最 为 
明显 。 但 是 无 论 什 么 时 候 , 只 要 我 们 使 用 来 自控 制 条 件 下 的 信息 来 指导 其 
他 背景 下 的 干预 措施 ， 就 有 必要 想 一 想 效 果 和 效力 的 差别 是 什么 。 

比如 ， 由 于 在 日 常生 活 中 ， 人 们 不 太 注 意 血 样 污染 和 洗手 的 问题 ， 
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所 以 指 尖 血糖 仪 在 现实 生活 中 测 出 来 的 结果 就 没有 在 控制 条 件 下 测 出 来 








的 结果 那么 准确 。 “在 一 项 研究 中 , 因为 某 种 药物 每 天 都 在 同一 时 间 服 用 ， 




















所 以 效力 很 高 ; 但 在 现实 生活 中 , 因为 每 天 服药 的 时 间 变 化 幅度 很 大 , 所 














以 它 的 效果 可 能 就 没有 那么 好 了 。 因此 , 如 果 我 们 只 假设 某 种 干预 措施 的 
效果 会 和 我 们 在 控制 条 件 下 观察 到 的 效果 或 者 在 研究 不 同人 和 群 时 看 到 的 
效果 一 致 , 那 我 们 可 能 会 高 估 这 种 干预 措施 的 实际 效果 。 因 为 病人 实际 上 
可 能 不 会 准时 服药 , 也 可 能 不 会 按 剂量 服药 , 还 可 能 会 在 疗程 结束 之 前 停 








止 服 药 。 

















效力 和 效果 不 同 的 可 能 性 的 大 小 ( 以 及 它们 之 间 差 别 的 大 小 ) SE 
接 影 响 我 们 对 干预 措施 的 选择 ,我 们 是 否 有 理由 认为 在 真正 实施 干预 措施 






































的 时 候 还 能 保持 同等 规模 的 影响 ”在 选择 不 同 的 干预 措施 时 , 我 们 不 仅 要 


考察 哪些 措施 是 有 效 的 ( 比如 


什么 样 的 干预 措施 让 人 们 点 的 食物 所 含 的 热 











EE PRES )， 还 要 考察 那些 有 效 措施 的 作用 有 多 大 比如 和 人们 点 的 食物 
所 含 的 热量 值 下 降 了 多 少 )。 如 果 在 理想 的 情况 下 (通常 就 是 在 最 好 的 情 
况 下 )， 人 们 点 的 食物 所 含 的 热量 值 只 下 降 了 一 点 点 ， 那 我 们 就 不 应 该 认 
为 这 项 干预 措施 在 现实 生活 中 的 影响 会 比 在 理想 情况 下 要 大 。 同 理 , 我 们 
还 必须 考虑 影响 规模 的 分 布 情况 。 如 果 人 们 点 的 食物 所 含 的 平均 热量 值 
































下 降 得 很 少 , 那 我 们 就 要 大 清楚 是 否 在 所 有 的 情况 下 热量 值 下 降 的 数量 
都 是 相似 的 ， 还 是 这 个 平均 数 掩盖 了 一 些 热量 值 下 降幅 度 极 大 和 极 小 的 
情况 ( 人们 在 一 个 地 方 点 的 食物 的 热量 值 下 降 了 很 多 , 而 在 男 一 个 地 方 点 
的 食物 的 热量 值 下 降 了 很 少 )。 

实施 干预 措施 的 环境 可 能 与 发 现 因果 关系 的 实验 环境 并 不 一 样 。 了 
解 这 一 点 可 以 帮助 我 们 预测 干预 过 程 中 可 能 出 现 的 失败 情况 , 并 且 帮 助 我 
们 提出 不 同 的 干预 策略 来 避免 出 现 干预 失 败 的 情况 。 因 此 , 在 决定 选择 什 
么 样 的 干预 措施 时 ， 不 仅 要 考虑 这 个 干预 措施 的 效果 如 何 ， 还 要 考虑 这 

















个 干预 措施 在 实际 出 现 的 条 伯 























F 下 是 否 能 够 取得 成 功 。 
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9.2.3 意外 的 结 


一 个 叫 作 田 纳西 州 STAR 项 


的 学 生 在 标准 化 考 








目的 随机 试验 发 现 , 被 分 到 小 规模 
试 中 的 成 绩 比 被 那些 分 到 规模 比较 大 的 班级 的 学 











好 。” 在 这 个 试验 




















于 级 
E 要 





1， 我 们 知道 实施 小 规模 班级 干预 措施 的 具体 细节 ,， 通 


过 随机 分 配 各 个 小 组 , 试验 考评 者 排除 了 其 他 因素 的 影响 , 确保 不 可 能 出 
现 某 个 既 会 导致 班级 规模 变 小 ,又 会 导致 学 生 考试 成 绩 变 好 的 因素 。 毕 


班级 规模 比较 小 的 学 校 由 于 种 种 原因 可 能 会 比 其 他 学 校 做 得 更 好 , 而 且 
规模 的 班级 可 能 也 只 是 为 我 们 提供 了 一 个 指示 器 , 指出 这 所 学 校 是 





























规模 班级 学 校 做 得 更 好 的 原因 。 


we. 


兄 ， 





























在 加 州 ， 人 们 

















小 


EE 有 让 小 


直 担 心 班级 规模 太 大 对 学 生 不 好 ， 随 着 田纳西 州 STAR 


项 目 得 出 的 积极 结论 ， 加 州 实施 了 一 个 数 十 亿美 元 的 项 目 来 缩小 班级 规 
模 。 在 田纳西 州 的 实验 中 , 教师 和 学 生 被 随机 分 配 到 规模 不 


在 加 州 , 州 政府 为 每 个 学 生 提 供 了 650 美元 的 奖励 措施 ， 
校 缩小 班级 规模 的 措施 。 这 个 项 目 很 快 为 各 个 学 校 所 采纳 ， 


















































级 规模 变 小 而 学 生 数 量 不 变 , 学 校 就 会 需要 更 多 的 老师 。 
不 上 不 断 增长 的 需求 , 在 这 项 政策 实施 后 , 教 响 




















的 班级 




















用 来 推进 各 个 学 
但 是 , 由 于 班 
1 于 师资 力量 跟 


队伍 中 无 经 验 老师 的 占 比 


在 那些 低 收入 校区 和 少数 民族 校区 ， 由 于 教室 的 数量 不 够 ， 这 个 政 
策 的 推行 时 间 更 长 了 。 由 于 教师 数量 不 够 , 这 个 政策 又 未 能 及 时 实施 , 这 
些 校 区 一 度 处 于 劣势 。 结果 , 这 些 校 区 最 终 招 聘 到 的 教师 中 有 20% 以 上 没 








有 各 种 资格 证 。” 然 而 ， 田 纳西 州 STAR RCT 的 一 个 主要 发 现 恰 | 























从 是 少数 


民族 的 学 生 从 小 规模 班级 中 受益 最 大 。 加州 迅速 激励 所 有 学 校 来 实施 这 个 





干预 措施 , 导致 加 州 学 校对 教师 的 需求 激增 ， 而 各 个 学 校 争 抢 师资 的 结果 














恰恰 证 那些 本 该 从 这 个 项 目 中 受益 最 大 的 学 校 落 在 了 后 面 。 
最 终 ， 人 们 并 不 认为 这 个 项 目 是 成 功 的 。 任 何 认为 这 个 项 目 有 益 的 
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论断 都 是 证 据 不 确 娄 的 ,或 者 只 在 小 范围 内 存在 的 。 而 且 ， 人 们 担心 这 个 
项 目 进一步 扩大 了 教育 上 的 差距 。 同时 , 即使 加 州 的 干预 措施 确实 在 一 些 
学 校 产生 了 一 点 效果 , 也 不 是 没有 代价 的 。 数 十 亿美 元 的 项 目 资金 意味 着 
这 些 钱 没 能 花 在 其 他 项 目 上 , 而 建新 教室 所 需 的 场地 也 是 从 其 他 项 目 ( 比 
如 特殊 教育 、 计 算 机 实验 室 和 图 书馆 等 ) 的 用 地 需求 中 分 出 来 的 。” 

专注 于 证 明 因 果 关 系 的 研究 一 般 不 会 进行 这 样 的 成 本 效益 分 析 ， 但 
对 于 一 项 干预 措施 的 实施 而 言 , 这 才 是 至 关 重 要 的 。 资 源 不 是 无 限 的 , 实 
施 了 一 个 项 目 就 意味 着 无 法 实施 另 一 个 项 目 。* 在 田纳西 州 的 班级 规模 缩 
小 项 目 中 , 项 目 实施 的 规模 很 小 , 只 有 那些 已 经 拥有 足够 的 教室 、 可 以 开 
设 新 班级 的 学 校 参与 其 中 。 而 且 这 项 研究 的 规模 还 不 足以 影响 整个 地 区 对 
教师 的 需求 。 

在 加 州 实施 这 个 干预 措施 之 前 ， 为 了 更 好 地 预测 这 项 政策 是 否 能 够 
取得 成 效 , 我 们 本 应 该 将 这 项 政策 的 实施 背景 和 面临 的 限制 ( 比如 空间 限 
制 ) 考虑 进来 ,并 且 判 定 其 他 变量 会 发 生 什么 样 的 变化 〈 比如 这 个 项 目 会 
分 走 其 他 项 目的 资源 )。 意外 的 结果 会 以 很 多 形式 出 现 : 一 项 干预 措施 可 
能 会 有 副作用 ， 这 就 意味 着 它 不 仅 会 导致 目标 结果 ， 还 会 导致 其 他 结 
比如 一 种 药物 可 能 会 消除 患者 的 头痛 证 状 , 但 是 也 会 导致 患者 出 现 疲惫 的 
症状 。 然 而 , 这 并 不 会 改变 系统 的 性 能 。 但 是 ， 人 们 对 自行 车 共享 计划 的 
担忧 之 一 就 是 它 有 可 能 会 对 健康 产生 完全 负面 的 影响 , 比如 使 用 公共 自行 
车 的 大 部 分 人 都 是 没有 经 验 的 骑 行 者 , 这 就 会 导致 “在 城市 骑 自 行车 ”成 
为 一 种 很 不 安全 的 行为 。 

这 正 是 加 州 班级 规模 缩小 计划 出 问题 的 地 方 。 新 的 政策 并 不 能 只 缩 
小 了 班级 规模 而 保持 其 他 所 有 变量 不 变 。 由 于 这 个 大 项 目的 实施 速度 很 
快 , 结果 导致 有 些 地 区 的 教师 质量 出 现 了 差异 , 并 且 其 他 项 目的 实施 空间 
和 经 费 也 遗 到 了 缩减 。 

除了 要 关注 一 项 干预 措施 是 否 会 直接 实现 其 目标 以 外 ， 还 要 考虑 这 
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项 干预 措施 还 可 能 会 导致 什么 其 他 的 结果 。 如 果 我 们 要 预测 一 个 模型 , 那 








只 需 设 定 班级 规模 这 个 变量 为 真 或 为 假 就 可 以 了 ， 
此 








这 
济 刺激 的 资金 又 是 从 其 他 项 目 挪 出 来 的 , 并 且 新 开 


Ko 最 终 我 们 还 是 需要 一 个 更 加 详细 的 模型 ( 这 个 


























但 是 这 个 模型 无 法 反映 


情况 下 将 会 发 生 的 事情 : 缩小 班级 规模 是 通过 经 济 刺激 实现 的 , 而 经 


设 的 班级 没有 足够 的 师 
模型 既 可 以 是 一 个 我 们 


了 解 的 因果 关系 模型 ， 也 可 以 是 一 个 我 们 构建 的 模拟 模型 )， 这 个 模型 不 
仅 要 包括 一 个 原因 , 还 要 包括 实施 这 个 原因 的 方法 , 这 样 的 模型 能 够 让 我 





们 对 比 各 种 缩小 班级 规模 的 方法 , 也 就 是 说 , 我 们 








可 以 先 针对 一 些 教育 水 





平 不 高 的 地 区 进行 实验 , 然后 评估 干预 措施 取得 的 成 效 , 而 不 是 直接 在 全 
州 范围 内 进行 推广 ; 也 可 以 先 对 不 同 的 刺激 计划 进行 测试 ， 等 等 。 当 然 ， 











并 不 是 所 有 意外 的 结果 都 是 负面 的 .有些 意外 的 结 























果 可 能 会 向 我 们 展示 干 

















预 措施 更 多 意 想不到 的 好 处 ， 从 而 为 某 项 干预 政策 的 实施 提供 更 多 的 文 








持 , 比如 说 公共 自行 车 项 目 降低 了 空气 污染 程度 ， 
是 一 个 积极 的 副作用 。 





那么 这 样 的 意外 结果 会 








之 所 以 会 出 现 这 些 副 作用 ， 有 时 是 因为 我 们 无 法 孤立 地 操纵 一 件 事 。 











我 们 所 实施 的 不 再 是 “那个 干预 措施 ”， 而 是 需要 








同时 改变 多 个 因素 。 我 











们 不 能 只 是 让 公共 自行 车 能 为 人 们 所 用 , 而 是 需要 








像 实施 自行 车 共享 政策 


一 样 来 同时 实施 保护 性 自行 车 道 政 策 。 这 可 能 是 大 家 都 想 推广 骑 行 导致 














的 ， 也 可 能 是 作为 保证 公共 自行 车 项 目 安全 的 一 个 必要 条 件 实施 的 。 
因此 ， 我 们 可 能 会 在 相似 的 时 间 段 内 实施 多 种 政策 ， 这 些 政策 可 能 





也 会 以 无 法 预测 的 方式 相互 作用 。 比 如 , 一 项 并 不 





be Bt AEN) AT EEE 











项 目 也 许 会 和 一 项 要 求人 们 使 用 头盔 的 法 律 同时 玫 
意 随身 携带 他 们 自己 的 头盔 ,那么 这 项 法 律 可 能 会 
车 的 次 数 。 由 于 我 们 无 法 立即 确定 是 哪 一 个 干预 措 























F 始 实施 。 如 果 人 们 不 愿 
减少 人 们 使 用 共享 自行 
施 导致 了 哪些 明显 的 效 














应 , 所 以 多 个 事件 同时 改变 增加 了 计划 和 评估 干预 措施 的 难度 。 然而， 如 
果 我 们 了 解 了 不 同 的 组 成 部 分 ， 就 能 对 它们 一 一 做 出 解释 。” 
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， 想 要 阅读 这 一 领域 很 多 研究 的 文献 回顾 ， 参 见 Swartz 等 (2011 )。 这 个 文 








献 回顾 后 来 在 内 容 上 又 进行 了 补充 和 更 新 ， 将 假设 性 的 食物 选择 包括 了 进 
去 (Kiszko 等 ，2014 )。 亦 见 Krieger 和 Saelens ( 2013 )。 





. Elbel 4 (2009 )。 

. Carels 4 (2007 )。 

. Downs 等 (2013 )。 

. Ellison 等 (2014 ) 和 Sonnenberg 等 (2013 )。 

. Bollinger 等 (2011 )。 

. 想 要 了 解 这 方面 的 例子 ， 参 见 Dumanovsky 等 (2011), Dumanovsky 等 

















(2011 ) 在 纽约 市 的 相关 立法 颁布 后 ， 考 察 了 一 些 餐 厅 菜 单 的 变化 。 








. Kearney Ñ Levine (2014 )。 





Vandenbroucke ( 2004 )。 


.正如 Smith 和 Pell (2003 ) 在 这 篇 统计 学 文章 中 指出 的 那样 ， 到 目前 为 止 











还 从 来 没有 出 现 过 一 个 测试 降落 伞 的 RCT。 


. Hill (1965 )。 
.为 什么 这 些 内 容 不 能 成 为 一 个 清单 呢 ? 想 要 了 解 更 多 这 方面 的 信息 ， 参 见 





Rothman 和 Greenland (2005 ) 和 Phillips 和 Goodman ( 2004 )。 








. 想 要 了 解 更 多 关于 Hill 考虑 的 因素 所 起 作用 的 讨论 ， 参见 Höfler (2005 ); 





Ward (2009 )。 

Erickson (1978 )。 

想 要 了 解 关于 这 一 内 容 的 更 多 讨论 ， 参 见 Howick% (2009 )。 

Schoenfeld 和 Ioannidis ( 2013 )。 

想 要 了 解 更 多 关于 复制 和 评估 复制 的 内 容 ， 参 见 Brandt 等 (2014 )。 
比如 说 ，Hil (1965 ) 就 认为 这 不 应 该 是 必要 条 件 ， 还 有 更 坚定 地 支持 他 
的 看 法 的 人 。 当 然 ， 关 于 这 个 条 件 的 批判 主要 集中 在 这 个 条 件 是 否 要 求 各 
个 原因 只 有 一 个 单一 结果 这 一 问题 上 (Rothman and Greenland, 2005 ) 48 
要 了 解 关 于 特异 性 作用 的 更 为 积极 的 观点 ， 参 见 Weiss (2002 ). 
这 个 例子 来 自 于 Weiss ( 2002 )。 

Hanushek (2011 )。 

参见 第 $ 章 关 于 这 一 内 容 的 讨论 ， 并 参考 Mill (1843 )。 

Snow (1854 )。 
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23. 第 7 章 讨论 了 各 种 运行 机 制 。 想 要 了 解 更 多 信息 ， 参 见 Glennan (1996 ) 
和 Machamer 等 (2000 )。 

24. Russo 和 Williamson ( 2007 )。 

25. 想 要 了 解 更 多 关于 各 种 类 型 连贯 性 的 信息 ， 参 见 Susser (1991 )。 

26. 甚至 那些 使 用 不 同 的 方法 分 析 同 样 数据 的 研究 人 员 对 此 得 出 的 结论 也 各 
不 相同 (Seok 等 ，2013; Takao 和 Miyakawa, 2014 )。 

27. 想 要 回顾 这 方面 的 研究 ， 参 见 Reiss (2014 )。 

28. 古 德 哈 特 定律 本 质 上 是 说 ， 一 旦 我 们 在 政策 中 使 用 某 个 工作 指标 ， 这 个 指 
标 就 不 再 是 衡量 我 们 工作 业绩 的 一 个 准确 的 指标 了 。 想 要 了 解 更 多 信息 ， 
参见 Chrystal 和 Mizen ( 2003 )。 

29. 想 要 了 解 这 方面 的 例子 ， 参 见 Guyatt 等 (2008 ); Howick “ (2011 )。 

30. DeMaio ( 2009 )。 

31. Goldman “ (2007 ). 

32. Buck 和 Buehler (2012 )。 

33. McLean 4 (2014 )。 

34. 想 要 了 解 更 多 关于 辅助 因素 作用 的 讨论 ， 参 见 Cartwright (2012 )。 

35. 想 要 回顾 在 医疗 卫生 领域 将 效力 转化 为 效果 的 各 种 困难 ， 参 见 Glasgow 
等 (2003 )。 

36. 想 要 了 解 这 方面 的 例子 ， 参 见 Perwien 等 (2000 )。 

37. Blatchford 和 Mortimore ( 1994 )。 

38. Bohrnstedt 和 Stecher ( 2002 )。 

39. Jepsen 和 Rivkin (2009 ). 

40. Bohrnstedt 和 Stecher ( 2002 )。 

41. Bohrnstedt 和 Stecher ( 2002 )。 

42. 比如 说 ， 缩 小 班级 规模 计划 就 需要 和 其 他 可 能 带 来 同样 效果 的 、 成 本 不 同 

的 方案 进行 对 比 (Normore F Ilon, 2006 ), 亦 见 Krueger ( 2003 ); Krueger 

和 Whitmore (2001 )。 

43. 比如 ，Craig 等 ( 2008 ) 就 介绍 了 人 们 在 复杂 的 医学 干预 措施 上 的 研究 进展 ， 

对 这 些 措施 进行 了 评估 , 文中 的 很 多 指导 原则 同样 适用 于 很 多 其 他 领域 。 















































































































































































































































第 10 章 展望 


为 什么 要 研究 因果 关系 ? 


10.1 人 们 需要 因果 关系 





自 亚 里 士 多 德 关于 因果 关系 的 重要 论著 问世 ， 已 经 过 去 了 几 千 年 ; A 
休 谎 对 因果 关系 提出 两 个 定义 , 已 经 过 去 了 几 百 年 ; 自 人 们 可 以 通过 强大 
的 新 型 计算 机 实现 因果 关系 推理 自动 化 , 也 已 经 过 去 了 几 十 年 。 然 而 时 至 
今日 , 因果 关系 仍然 是 一 个 悬而未决 的 问题 。 人 们 一 不 小 心 就 会 推理 出 一 
些 并 不 存在 的 因果 关系 ,而 我 们 的 计算 程序 也 不 是 万 无 一 失 的 。 更 糟糕 的 
是 ,即便 我 们 能 够 找到 一 个 原因 ， 由 于 收集 和 理解 信息 方面 的 局 限 性 , 我 
们 仍然 很 难 使 用 这 个 原因 来 防止 或 促使 某 个 结果 发 生 。 看 完 那 么 多 因果 分 
析 方 法 无 效 的 案例 和 政策 制定 者 彻 底 弄 错 因 果 关 系 的 案例 ， 你 可 能 会 想 ， 
我 们 为 什么 还 要 如 此 费力 地 研究 因果 关系 呢 ? 
在 一 些小 实验 中 ， 我 们 每 次 只 能 有 规律 地 改变 一 个 变量 来 发 现 一 个 
系统 的 运行 机 制 。 幸 运 的 是 ,我们 现在 已 经 不 再 受 这 些小 实验 的 限制 了 。 
现在 我 们 拥有 了 大 规模 的 数据 , 以 数字 形式 记录 了 人 们 的 购物 习惯 、 病 历 
以 及 各 种 活动 。 很 有 可 能 你 随身 就 携带 着 手机 形式 的 加 速 感应 器 和 GPS 
定位 器 , 无 论 你 去 哪里 它们 都 会 跟着 你 , 而 且 你 的 线 上 活动 也 在 以 各 种 方 
式 被 跟踪 着 。 互联 网 的 特性 、 电 子 病历 的 传播 以 及 无 处 不 在 的 感应 器 使 我 
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们 获得 的 关于 人 类 的 活动 数据 比 历 史上 任何 时 候 都 要 多 。 有 了 这 么 多 的 原 


始 材料 ,也 许 





事情 发 4 





E 的 原因 已 不 再 重要 。 有 些 人 其 























掘 这 些 数据 来 了 解 事物 之 间 的 相关 性 就 足够 了 。， 
有 了 这 么 多 粒度 如 此 细 的 数据 〈 比如 某 个 人 买书 的 顺序 、 人 们 所 走 
的 每 一 步 以 及 数 百 万 的 政治 竞选 电话 的 效果 ), 零售 商 可 以 针对 潜在 消费 














者 的 情况 制作 














三 告 ， 





至 认为 ,我 们 通过 挖 


健身 公司 可 以 估算 出 你 已 经 消耗 了 多 少 热量 ， 而 政治 


竞选 团队 则 可 以 找 出 那些 能 够 被 游说 的 选民 。 海 量 数据 确实 可 以 让 我 们 的 

















BU ENED 








一 双 鞋 子 , ABA FT 4 





,但 如 果 我 们 想 要 知道 的 只 是 谁 有 可 能 会 根据 一 条 广告 去 买 








F 并 不 在 意 这 些 广告 为 什么 会 起 作用 ,也 不 会 在 意 


是 否 有 几 个 预测 弄 错 了 。 在 这 种 情况 下 ， 就 不 要 去 想 理论 的 事 了 ,也 不 要 
想 着 去 解释 事物 发 生 的 原因 了 ， 所 有 的 答案 都 在 数据 之 中 。 


当然 ， 我 们 也 不 是 所 有 时 候 都 会 使 
































用 “原因 ”这 个 词 。 对 这 些 数据 


的 分 析 也 许可 以 揭 开 事物 之 间 的 关联 性 、 相 关 性 、 关 系 、 纽 带 和 联系 ,可 





以 揭 开 事物 的 发 展 趋势 以 及 事物 发 展 过 程 














的 风险 因素 。 











虽然 这 些 词 语 的 





意思 相近 , 但 人 们 和 常常 会 将 这 些 发 现 当 成 是 原因 来 采取 行动 。 但 是 , 我 们 





控制 将 要 出 现 


























的 结果 


SAAR 











o 即使 你 在 工人 























使 用 这 些 数据 主要 是 为 了 和 弄 清楚 将 来 会 出 现 什么 情况 , 以 便 可 以 改变 或 者 
E 中 并 不 分 析 这 些 数据 , 也 没有 兴趣 挖 
据 各 种 设备 ( 比如 健身 追踪 器 ) 的 数据 所 呈现 出 的 规律 ,你 却 无 法 避免 其 
他 人 所 做 的 数据 分 析 的 结果 对 你 的 影响 。 有 一 项 新 政策 规定 : 如 果 人 们 
戴 计 步 器 , 他 们 所 交 的 保险 费 费 率 就 可 以 降低 , 你 会 支持 这 项 政策 吗 ? SE 
药 时 , 你 为 什么 会 选择 这 种 药 而 不 选择 那 种 药 ? 在 这 些 情况 下 , 相关 性 是 
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没有 
似乎 

什么 "， 到 成 年 人 总 想 找到 “是 谁 
外 地 想 要 知道 事情 发 生 的 原因 。 





果 关 系 绝 不 像 一 个 多 世纪 前 Bertrand Russel 说 的 那样 





用 的 。 即 使 我 们 能 够 根据 相关 性 成 功 地 预测 并 干预 事件 的 发 展 , 我 们 
岂 不 可 避免 地 想 知 道 事情 为 什么 会 这 样 发 生 。 从 孩子 们 总 喜欢 问 “ 为 
E 的 错 ” 或 者 “该 怪 谁 ”"， 我 们 似乎 无 一 例 
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252 ， 别 拿 相关 当 因 果 
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经 过 去 了 的 时 代 的 遗迹 ”"。" 今 天 ， 随 着 我 们 收集 的 这 些 数据 集 越 来 越 大 ， 
果 关 系 以 及 对 因果 关系 进行 批判 性 思考 的 能 力 比 以 前 任何 时 候 都 更 加 
必要 。 现在 对 我 们 来 说 , 知道 什么 时 候 能 够 找到 原因 以 及 什么 时 候 找 不 到 
原因 与 会 读书 写字 一 样 重要 。 当 我 们 从 数 百 万 的 测试 中 提取 出 一 些 埋藏 在 
电子 碎片 中 的 有 意义 的 信号 时 , 我 们 很 有 可 能 会 完全 由 于 偶然 因素 发 现 一 
些 似 乎 具有 显著 性 的 结论 。 因 此 , 我 们 也 越 来 越 需要 对 任何 发 现 持 有 怀疑 





DE, 当 我 们 无 法 通 






































过 实验 对 每 一 个 发 现 加 以 验证 时 ， 各 种 统计 法 可 以 




















帮助 我 们 控制 虚假 发 现 的 数量 。 但 是 , 如 果 能 知道 为 什么 一 个 虚假 的 关系 

















可 能 会 出 现在 研究 结论 中 ， 我 们 就 更 能 将 因果 关系 和 相关 性 区 分 开 来 。 
人 们 关于 大 数据 的 误解 之 一 就 是 认为 它 不 过 是 更 多 的 数据 而 已 一 一 
更 多 的 个 体 、 更 多 的 时 间 点 和 更 多 的 变量 。 但 是 , 大 数据 的 收集 绝 不 仅仅 
































是 将 一 个 小 的 数据 集 志 


大 而 已 。 要 想 获得 几 个 电话 号 码 , 我 们 可 以 查 电话 











号 码 短 并 仔细 核对 每 一 个 电话 号 码 的 真实 性 。 给 朋友 打 电 话 时 , 我 们 清楚 
地 知道 手中 的 电话 号 码 是 谁 的 、 这 个 号 码 是 个 人 号 码 还 是 住宅 号 码 , 以 及 
































这 个 号 码 是 手机 号 码 还 是 固定 电话 号 码 。 相反， 当 我 们 需要 数 百 万 的 电话 
号 码 时 , 我 们 根本 不 可 能 了 解 所 有 号 码 的 每 一 个 使 用 者 ,而且 我 们 必须 从 

















各 种 渠道 ( 比如 商业 数据 库 和 电话 号 码 单 ) 来 获得 这 些 电 话 号 码 。 这些 号 
码 可 能 已 经 失效 或 者 不 准确 了 ， 而 且 我 们 也 无 法 一 个 一 个 地 验证 这 些 号 























有 些 人 可 能 已 经 搬家 了 ,有 些 人 可 能 已 经 将 电话 号 码 易 主 了 , 还 有 一 





1 
些 





号 码 可 能 已 经 停 用 了 。 在 大 数据 库 中 , 出 现 噪声 和 错误 的 概率 往往 会 增 


加 ,所 以 , 这 种 权衡 也 许 并 不 像 人 们 看 到 的 那么 简单 。 与 更 小 且 可 控 的 数 
据 集 相 比 ， 大 数据 库 中 存在 更 多 的 数据 质量 问题 、 更 多 潜在 的 错误 来 源 、 
更 多 的 偏差 以 及 更 多 缺失 的 数据 。 在 海量 数据 集中 ， 变 量 更 加 难以 解释 ， 








而 数据 收集 的 时 间 表 和 全 
事件 发 生 的 原因 ; 相反 ， 大 数据 让 事件 发 生 的 原因 变 得 更 加 重要 了 。 




















FE 往 也 各 不 相同 。 大 数据 并 没有 让 人 们 不 再 需要 了 解 
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我 们 不 仅 需 要 找到 因果 关系 ,还 需要 对 因果 所 在 的 领域 有 深入 的 了 
解 , 这 样 才 有 可 能 知道 一 个 测试 是 否 是 成 功 的 , 并 且 能 够 解释 测试 得 出 的 
结论 。 在 一 个 研究 项 目 中 , 我 们 分 析 了 来 自 神经 科 重 症 监护 室 的 数据 , 想 






































要 了 解 是 什么 因素 导致 中 风 病 人 的 大 脑 二 次 受伤 的 。 在 重症 监护 室 , 医生 




















通过 降低 病人 的 体温 来 促进 病人 的 康复 进程 , 有 些 病 人 的 体温 甚至 下 降 到 


了 华氏 68 度 〈 约 为 20 摄氏 度 )。 这 个 
人 病 得 很 重 , 所 以 他 们 身上 的 很 多 指标 











体温 似乎 异常 的 低 ， 但 由 于 这 些 病 
的 数值 都 是 不 正常 的 。 如 果 我 们 想 




















要 知道 华氏 68 度 是 否 意味 着 非常 严重 的 低 体 温 症 并 且 想 要 对 这 个 数值 提 
出 怀疑 ,就 必须 预先 掌握 一 些 生 理学 知识 。 如 果 我 们 想 要 准确 地 知道 为 什 
么 会 有 这 么 低 的 体温 记录 ,就 要 掌握 更 专业 的 知识 。 然而, 很 多 临床 医生 














只 要 看 一 眼 这 个 数值 就 会 立刻 明白 发 4 











ET 了 什么 。 病 人 的 体温 是 通过 插 在 膀 











胱 里 的 导 尿 管 测量 出 来 的 ， 所 以 如 果 导 尿 管 从 膀胱 里 滑 了 出 来 ， 导 尿 管 测 











量 的 温度 就 成 了 室内 温度 ， 而 室内 温度 恰 











好 在 华氏 68 度 左 右 。 在 了 解 了 





这 一 点 之 后 , 事情 就 很 明显 了 , 但 只 有 了 解数 据 以 及 数据 的 产生 方式 的 人 








才能 解释 为 什么 会 出 现 这 种 现象 。 








如 果 我 们 让 一 个 不 了 解 情况 的 人 去 数据 库 里 任意 发 掘 ， 他 可 能 就 会 
错误 地 发 现 低 体温 预示 着 病人 的 状况 将 会 得 到 改善 。 这 是 因为 导 尿 管 滑 出 
来 可 能 会 让 护士 们 对 这 个 病人 更 加 关注 , 从 而 迅速 发 现 病人 身上 可 能 存在 
的 其 他 问题 。 如 果 我 们 根据 这 样 一 个 相关 性 采取 行动 的 话 ， 就 很 有 可 能 
会 采取 一 些 无 效 的 干预 措施 ， 从 而 将 病人 的 体温 下 降 到 危险 的 程度 。 

除了 弄 清 楚 一 个 数值 是 否 正确 以 外 ， 想 要 知道 一 个 变量 的 含义 以 及 
这 个 变量 什么 时 候 会 消失 , 可 能 也 比 我 们 想象 的 难得 多 。 几 乎 所 有 计算 法 

















都 假设 我 们 已 经 测量 了 共同 的 原因 并 
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的 变量 组 合 是 “正确 的 ”。 然 

















而 ,如 果 数 据 不 能 表明 一 个 变量 的 真实 状态 , 或 者 一 个 共同 的 结果 才 是 一 


个 原因 有 没有 出 现 的 唯一 可 靠 指标 , 











Bb 么 那些 假设 的 条 件 并 不 足以 让 我 们 





搞 清 楚 上 述 问题 。 病 人 的 病历 中 可 能 会 有 该 病人 的 诊断 结论 , 之 所 以 会 出 
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现 这 个 诊断 结论 可 能 是 因为 计 费 的 需要 , 也 可 能 是 因为 医生 怀疑 病人 有 这 
种 症状 ,还 可 能 是 因为 病人 有 得 这 个 病 的 家 族 史 , 或 者 是 因为 其 他 原因 ( 比 
如 复制 粘贴 错误 )。“ 尽 管 这 个 值 存在 于 此 , 但 如 果 它 不 能 准确 反映 一 个 病 
人 是 否 得 了 某 种 疾病 ， 那 它 可 能 就 不 能 有 效 排除 某 个 原因 所 导致 的 结果 ， 
而 且 这 个 值 的 缺失 也 完全 有 可 能 是 文件 管理 失误 导致 的 。 如 果 一 个 病人 确 
实 得 了 糖尿 病 , 但 是 这 个 病 却 没有 恰当 地 记录 在 案 , 那么 我 们 就 有 可 能 错 
误 地 发 现 高 血糖 和 胰岛 素 之 间 存 在 相关 性 。 
在 某 些 情况 下 ， 我 们 需要 用 大 量 的 先 验 知识 来 区 分 在 不 同 的 时 间 表 
里 测量 出 来 的 变量 ( 以 便 测量 到 所 有 理论 上 能 够 测量 到 的 时 间 点 ) 和 缺乏 
数据 的 变量 。 医院 病历 数据 中 的 账单 代码 可 以 告诉 我 们 病人 是 由 于 什么 病 
入 院 的 , 有 时 这 些 病历 还 包括 病人 当前 症状 的 一 个 清单 。 如 果 一 个 病人 的 
一 次 就 诊 记 录 中 出 现 了 哮喘 症 , 但 是 其 他 就 诊 记 录 中 没有 出 现 关 于 哮喘 的 
记录 , 那 我 们 又 该 如 何 解 释 这 一 现象 呢 ? 由 于 哮喘 证 是 慢性 病 , 所 以 病人 
只 在 一 次 就 诊 时 有 哮喘 症 的 可 能 性 不 大 。 但是, 病人 却 有 可 能 只 在 那 一 次 
就 诊 时 治疗 了 哮喘 症 〈 因此 只 在 那 一 次 的 记录 上 出 现 了 哮喘 症 )。 然 而 ， 
要 想 知 道 我 们 还 缺少 哪些 数据 ( 一 名 临床 医生 错误 地 忽略 了 疾病 清单 上 的 
哮喘 病 ) 而 不 是 哪些 数据 是 错误 的 〈 像 流感 这 样 的 急性 病 不 会 拖 很 久 )， 
我 们 不 仅 需 要 对 问题 有 所 了 解 ， 还 需要 对 数据 产生 的 方式 有 所 了 解 。” 
最 好 的 情况 是 ， 那 些 错误 只 是 随机 性 噪声 ， 它 们 会 对 所 有 的 变量 产 
生 相 同 的 影响 。 但 事实 上 , 不 同 的 设备 有 着 不 同 的 错误 率 , 而且 人 们 回答 
有 些 问题 的 准确 率 可 能 也 会 高 于 另外 一 些 问 题 。 比 如 , 如 果 我 问 人 们 是 否 
吸烟 , 有 些 人 可 能 会 撒谎 , 还 有 一 些 人 可 能 会 将 问题 理解 为 他 们 现在 是 否 
在 吸烟 或 者 最 近 是 否 吸 过 烟 。 血压 的 测量 值 尤其 不 可 靠 , 所 以 我 们 可 能 会 
发 现 治疗 高 血压 的 降 压 药 成 了 一 个 人 是 否 患 有 高 血压 的 指标 。 我 们 还 会 发 
现 这 种 药物 和 其 他 症状 之 间 存 在 相关 性 ， 而 不 是 高 血压 和 其 他 症状 之 间 
存在 相关 性 。 我 们 需要 掌握 该 领域 的 知识 ， 才 能 了 解 这 种 药物 只 能 表明 











































































































































































































哪些 人 有 高 血压 ， 
最 后 ， 如 果 一 
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以 及 这 种 药物 本 身 并 不 会 引起 其 他 疾病 。 
些 大 的 数据 集 不 是 为 了 研究 目的 收集 的 ,那么 从 这 些 

















数据 集中 发 现 的 寻 
在 新 环境 或 未 来 





有 物 之 间 的 相关 性 可 能 不 太 具 有 普遍 性 , 这 就 限制 了 我 们 
环境 中 应 用 这 个 结论 的 能 力 。2010 年 ， 研 究 人 员 对 




















Facebook 的 用 户 进 行 了 一 次 测试 ， 想 要 了 解 如 果 他 们 一 登录 Facebook 就 


会 收 到 关于 投票 的 信息 , 那么 他 们 在 美国 国会 选举 中 参与 投票 的 可 能 性 是 
































会 提高 ， 尤 其 是 想 要 了 解 如 果 他 们 在 Facebook 上 看 到 他 们 的 朋友 们 都 

















万 )， 其 中 一 个 小 
链接 )， 男 一 个 小 





的 用 户 投票 情况 并 参考 公众 投票 记录 ,研究 人 员 佑 计 在 Facebook 上 发 布 的 














已 经 投票 了 ， 那 么 他 们 参与 投票 的 概率 是 否 会 提高 。“ 在 这 次 实验 中 ， 有 
6000 多 万 用 户 都 收 到 了 社交 信息 ， 这 些 信息 向 他 们 展示 了 他 们 的 一 部 分 朋 
友 已 经 在 Facebook 上 投 过 票 了 。 还 有 男 外 两 个 小 组 的 用 户 ( 每 组 大 约 60 

















组 只 收 到 了 投票 信息 ( 比如 一 个 如 何 找 到 当地 投票 点 的 
组 没有 收 到 任何 关于 选举 的 信息 。 通 过 对 比 这 三 个 小 组 



































社交 信息 直接 导致 投票 数 增加 了 约 6 万 票 (同时 又 间接 导致 投票 数 增加 了 

















约 28 万 票 )。 


然而 ， 增 加 的 6 万 多 票 与 6100 万 收 到 投票 信息 的 人 数 相 比 ， 投 票数 
增加 的 比例 还 不 足 0.1%。 这 个 绝对 数字 可 能 很 大 ， 但 这 次 缺乏 针对 性 的 
实验 之 所 以 能 够 取得 这 样 的 成 效 ， 完 全 是 由 这 个 巨大 的 社交 网 络 融 来 的 。 
如 果 我 们 在 一 个 更 小 的 社交 网 络 上 复制 这 一 实验 , 要 想 让 投票 人 数 显著 增 
加 ， 就 还 需要 一 个 不 同 并 且 更 直接 的 方法 。 事 实 上 ,看 到 好 朋友 投票 的 照 
片 似乎 要 比 看 到 关系 比较 远 的 人 的 投票 信息 更 为 有 效 。 但 是 , 进行 这 样 的 
筛选 需要 我 们 了 解 这 些 人 之 间 的 关系 。 考 虑 到 这 个 实验 的 规模 比较 小 、 
Facebook 和 其 他 社交 网 络 的 用 户 之 间 的 差别 以 及 各 个 实验 小 组 规模 的 差 





































































































别 , 我 们 无 法 立即 确定 这 个 干预 措施 可 以 有 效应 用 于 其 他 社交 网 络 或 者 除 
美国 以 外 的 选举 活动 。 
我 们 不 是 要 抛弃 因果 关系 ， 而 是 要 抛弃 那 种 黑匣子 思想 。 不 要 以 为 
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我 们 可 以 从 数据 源头 直接 获取 一 些 数据 放 进 黑匣子 , 然后 黑匣子 就 会 吐出 
一 系列 无 须 解 释 且 无 须 人 为 干预 的 原因 。 因 果 推 理 是 必要 且 充 满 可 能 性 
AY, 却 不 是 完美 的 。 最 重要 的 是 , 进行 因果 推理 需要 掌握 因果 关系 所 属 领 
域 的 专业 知识 。 






























































10.2 主要 原理 














研究 人 员 躲 在 他 们 各 自 所 属 学 科 的 简 仓 里 ， 就 发 现 和 使 用 原因 的 最 
好 的 方法 争论 不 休 。 这 很 容易 让 人 们 形成 这 样 印象 , 认为 有 很 多 互 不 相干 
的 领域 在 独立 地 对 问题 的 一 个 个 微小 部 分 起 作用 。 这 些 研究 人 员 没有 达成 
任何 明显 的 共识 , 而 且 每 种 方法 的 众多 局 限 性 导致 整个 研究 似乎 已 经 陷入 
绝境 。 即 使 我 们 真 的 需要 原因 ， 最 后 可 能 也 无 法 找到 它们 。 

确实 ， 因 果 关 系 问题 尚未 解决 ， 而 且 也 没有 能 够 适用 于 所 有 因果 关 
系 问题 的 理论 。 我 们 无 法 给 原因 下 一 个 适用 于 所 有 案例 的 定义 , 也 没有 一 
个 可 以 从 所 有 类 型 的 数据 中 找到 原因 的 方法 。 研 究 人 员 也 许 会 因为 这 个 领 
域 中 还 要 很 多 未 知 空间 而 对 因果 研究 充满 热情 , 但 如 果 你 不 是 一 名 研究 人 
员 ， 你 又 能 从 这 个 领域 学 到 什么 呢 ? 
虽然 我 们 并 未 掌握 关于 因果 关系 的 所 有 信息 ,但 也 确实 掌握 了 一 些 
信息 。 更 重要 且 更 激励 人 心 的 是 , 我 们 对 于 因果 关系 的 认识 已 经 随 着 时 间 
的 变化 更 为 深入 了 。 我 们 之 所 以 能 够 加 深 对 因果 关系 的 认识 , 一 方面 是 因 
为 我 们 有 了 更 好 的 数据 和 更 强大 的 计算 能 力 , 另 一 方面 是 因为 各 个 领域 的 
不 断 重 至 和 器 学 科研 究 不 断 发 展 。 


10.2.1 因果 关系 和 相关 性 不 是 同义词 


本 书 最 大 的 启示 之 一 在 于 ， 要 想 找 到 事情 发 生 的 原因 绝 不 是 一 件 容 
易 的 事 。 很 多 时 候 我 们 认为 自己 已 经 找到 了 原因 , 但 实际 上 我 们 找到 的 只 

























































































































































































事物 之 间 的 相关 性 而 已 , 而 





是 
念 混乱 造成 的 ( 考察 的 变量 不 正确 , 结果 在 
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有 有 时 连 这 些 相 关 性 都 是 假 的 。 这 可 能 是 概 

















| 一 个 共同 原因 导致 的 多 个 结 














果 之 间 找 到 了 一 个 虚假 的 关系 ), 也 可 能 是 我 们 在 寻找 和 评估 信息 的 方式 存 








在 偏差 导致 的 (证 实 性 












































可 能 是 我 们 考察 的 很 多 其 他 因素 导致 的 。 

有 很 多 方法 可 以 让 我 们 在 没有 因果 关系 的 情况 下 也 能 发 现 事 物 之 间 
的 相关 性 ( 反之 亦 然 )。 知 道 这 些 方法 很 重要 ， 因 为 它 能 帮助 我 们 批判 性 
地 评估 我 们 的 发 现 和 假设 ,还 可 以 防止 我 们 去 采取 一 些 无 效 的 干预 措施 。 
假设 菜 人 发 现 他 跑步 的 距离 和 他 的 精力 水 平 之 间 存 在 相关 性 。 令 人 感到 
意外 的 是 ,他 跑步 的 距离 越 长 ， 他 的 精力 似乎 就 越 旺盛 。 但 是 ， 如果 只 有 











在 空闲 时 间 比 较 多 且 能 


















































遍 差 意味 着 我 们 只 会 去 寻找 那些 正面 的 例子 )， 还 




















重 懒 觉 的 日 子 里 , 他 的 跑步 距离 才 会 变 长 , 那么 


他 真正 会 发 现 的 结论 应 该 是 睡觉 的 时 间 越 长 , 他 的 精力 就 越 旺盛 。 在 这 种 
情况 下 ,如 果 他 预测 跑 完 一 场 马拉松 比赛 后 , 他 的 能 量 一 定 会 激增 ,那么 
这 样 的 预测 一 定 会 失败 。 这 意味 着 对 他 来 说 , 要 想 感到 精力 充沛 ， 最 好 的 
策略 就 是 多 睡觉 而 不 是 多 跑步 。 

不 论 数据 的 大 小 如 何 ， 我 们 都 必须 对 我 们 的 发 现 进行 质疑 ， 要 多 问 








问 “ 为 什么 ”。 比 如 ， 通 过 使 月 
谷歌 预测 出 流感 趋势 的 时 间 比 疾 控 中 心 还 要 





月 人 们 的 搜索 词 和 流感 病例 之 间 的 相关 性 ， 





早 。 但 是 ,这 种 方法 只 有 在 








这 样 的 前 提 条 件 下 才 会 有 效 : 人 们 3 
引擎 检索 这 些 搜索 词 ; 人 们 进行 搜索 不 是 因为 他 们 担心 流感 暴发 , 也 不 是 
因为 家 里 有 人 出 现 了 流感 症状 , 更 不 是 因为 他 们 听 说 了 谷歌 的 这 个 研究 项 























要 在 有 流感 证 状 时 才 会 使 用 谷歌 搜索 








目 。 事 实 上 ， 随 着 时 间 的 变化 ,谷歌 预测 流感 趋势 的 表现 越 来 越 差 。2011 








年 , 谷歌 预测 的 流感 严重 程度 要 比 实 
且 在 之 后 的 很 长 一 段 时 间 里 ， 它 预测 上 




















际 观 察 到 的 流感 严重 程度 高 得 多 ,而 
9 数据 都 比 实际 数据 要 高 。* 如 果 我 


们 不 清楚 为 什么 某 件 事情 具有 预测 作用 的 话 , 那 我 们 的 预测 就 不 可 避免 地 


会 出 现 意料 之 外 的 失败 。 
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10.2.2 ”针对 偏差 的 批判 性 思 


























虽然 有 很 多 容易 出 错 的 地 方 ， 但 如 果 能 够 找 出 这 些 容易 出 错 的 地 方 


并 因此 提高 警惕 ， 我 们 就 能 够 设计 出 更 好 的 方法 和 更 加 有 效 的 干预 措施 ， 




















还 能 避免 推理 出 错误 的 结论 。 我 们 之 所 以 要 月 











系 的 心理 学 问题 , 是 因为 如 果 了 解 了 我 们 在 盟 











上 一 整 章 的 内 容 来 讨论 因果 关 
p 些 地 方 擅长 寻找 原因 , 就 能 








够 设计 出 更 好 的 方法 来 让 这 一 过 程 自动 化 , 同时 也 是 因为 如 果 能 找到 我 们 





























思维 中 容易 出 错 的 地 方 , 就 能 更 好 地 处 理 这 些 薄 弱 区 域 。 这 可 能 意味 着 我 


们 在 避免 认 知 偏差 时 要 提高 警觉 ,，” 意味 着 我 们 要 设计 出 一 些 可 以 更 好 地 
处 理 选择 性 偏差 的 计算 程序 , “或 者 意味 着 我 们 要 将 数据 清理 和 分 析 任 务 

















交 给 不 同 的 、 对 研究 假设 一 无 所 知 的 人 来 做 ， 
差 这 样 的 错误 。， 








以 避免 无 意 中 犯 下 证 实 性 偏 


心理 学 为 我 们 理解 一 些 长 期 存在 的 哲学 问题 ( 比如 道德 评价 和 因果 
判断 之 间 的 关系 ) 提供 了 一 些 启示 , 同时 还 建议 我 们 应 该 更 加 关注 外 部 有 
效 性 以 及 我 们 对 推理 方法 和 解释 方法 的 评价 。 

在 很 多 情况 下 ， 我 们 需要 从 不 同 来 源 收集 的 数据 要 比 一 开始 计划 的 
多 得 多 。 心理 学 领域 有 一 个 重要 发 现 : 人 们 可 能 不 仅 在 引起 某 个 事件 的 原 























因 上 存在 分 歧 , 而 且 在 看 待 引起 同一 个 事件 的 不 同 原因 的 相对 显著 性 上 也 
存在 分 歧 。 这 些 分 歧 可 能 来 自 于 文化 上 的 差异 , 在 我 们 设计 用 来 寻找 原因 
的 各 种 方法 时 ， 有 必要 意识 到 这 种 文化 差异 。 在 哲学 上 ， 人 们 经 常 通过 分 




















析 来 评估 一 些 案例 ， 以 便 了 解 某 个 理论 是 否 给 出 了 我 们 想 要 的 答案 ， 这 就 























表明 一 个 人 的 直觉 并 不 一 定 具 有 普遍 性 。 








加 拿 大 的 某 位 教授 认为 的 导致 某 人 考试 作 浆 的 原因 也 许 和 印度 某 位 
农民 的 想法 不 一 致 。 甚 至 在 Michotte 的 这 种 简单 的 因果 关系 感知 研究 中 ， 
也 不 是 所 有 参与 者 都 会 以 同样 的 方式 来 感知 一 些 场景 。 实 体 因果 关系 往往 
更 加 复杂 , 很 多 不 同 的 答案 都 有 可 能 是 正确 的 ,而 且 或 多 或 少 在 不 同 的 案 
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例 中 都 有 所 关联 。 交 通 事故 可 能 是 多 种 原因 共同 导致 的 , 比如 汽车 生产 商 
的 失职 、 驾 驶 员 注意 力 不 集 中 以 及 恶劣 的 天 气 情况 。 但 是 , 法 律 案件 关注 
的 重点 和 其 他 案件 关注 的 重点 是 不 一 样 的 。 这 些 解 释 上 的 差异 还 会 影响 陪 
审 团 的 决定 ， 并 最 终 影 响 陪 审 团 的 甄选 过 程 。 

实验 哲学 领域 的 研究 曾 试图 明确 陪审 团 做 的 这 些 判 断 到 底 有 多 大 的 
差别 , 并 试图 找到 是 哪些 因素 导致 陪审 团 形成 了 不 同 的 观点 并 改变 了 评估 
案件 的 方式 。 尽 管 目前 还 没有 一 个 完美 的 理论 能 够 解释 人 们 是 如 何 划分 责 
任 或 确定 实体 原因 的 ,但 使 用 认 知 心理 学 的 实验 法 来 解决 哲学 问题 可 以 帮 
助 我 们 在 评估 这 些 方法 的 过 程 中 摆脱 对 个 体 直 觉 的 依赖 。 

为 了 验证 这 些 方法 的 有 效 性 ， 我 们 需要 准确 客观 的 真相 ( 导致 某 个 
事件 发 生 的 真实 原因 )， 以 此 来 衡量 使 用 各 种 方法 得 到 的 结论 。 但是， 如 
果 解 释 是 主观 的 , 真相 也 是 因 人 而 异 的 , 那么 我 们 就 需要 重新 评估 我 们 的 
验证 方案 了 。 比 如 说 ， 如 果 我 们 对 众 包 工人 比如 亚马逊 士 耳 其 机 器 人 ) 
进行 民意 测验 , 或 者 对 某 个 社交 网 络 的 使 用 者 进行 问卷 调查 , 那么 我 们 就 
应 该 更 关注 结论 中 的 文化 偏差 , 并 且 在 多 个 文化 背景 下 复制 这 项 调查 ,以 
保证 参与 者 在 人 口 统计 学 上 的 多 样 性 。 


10.2.3 时间 的 重要 性 


1948 年 美国 总 统 大 选 当晚 ,《 芝 加 哥 论 坛 报 》 的 大 字 标 题 印刷 错误 ， 
写成 了 “杜威 打败 杜鲁门 "。” 这 件 事 在 当 时 非常 有 名 。 这 份 报纸 必须 在 
选举 结果 确定 之 前 付 印 ， 而 当时 Gallup, Roper Ail Crossley 所 做 的 民意 调 
查 都 预测 杜威 会 取得 决定 性 的 胜利 。 之 所 以 会 出 现 这 样 的 情况 ,一 方面 是 
由 于 取样 方法 不 当 , 导致 共和 党 人 在 样本 中 所 占 的 比例 过 高 , 另 一 方面 是 
由 于 这 些 机 构 停止 进行 民意 调查 的 时 间 过 早 ,， 有些 机 构 甚 至 在 9 月 份 ( 选 
举 正式 举行 之 前 的 两 个 月 ) 就 停止 民意 调查 了 。 ”他们 假设 人 们 是 否 会 投 
票 以 及 打算 把 票 投 给 谁 这 一 结果 在 最 后 的 几 个 月 内 不 会 发 生 改 变 。 而且 这 
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些 民意 测验 的 结果 可 能 也 影响 到 了 选举 。“ 杜 威 似乎 很 明显 会 成 为 最 后 的 
赢家 ”的 念头 可 能 会 让 他 的 支持 者 们 过 于 自信 , 从 而 大 大 降低 了 在 选举 当 
日 去 投票 的 可 能 性 。 相 反 , 杜鲁门 的 支持 者 们 可 能 会 由 于 民意 测验 的 情况 
不 好 而 受到 激励 ， 导 致 他 们 去 参加 投票 的 可 能 性 大 大 增加 。 

同 理 ， 人 们 在 计算 疾病 风险 时 可 能 也 会 因为 使 用 了 历史 数据 而 高 估 
了 疾病 在 当前 人 口中 暴发 的 风险 ,我 们 必须 搞 清楚 数据 和 因果 关系 有 没有 
可 能 随 着 时 间 的 变化 而 发 生 改变 , 以 及 它们 在 我 们 研究 的 那个 时 刻 是 否 仍 
然 适用 。 
不 管 是 寻找 物理 事件 中 的 因果 关系 ( 在 缺乏 机 械 知 识 的 情况 下 ， 时 
间 上 的 滞后 会 导致 人 们 认为 事物 之 间 可 能 存在 因果 关系 的 可 能 性 下 降 )， 
还 是 评估 干预 政策 ( 在 评估 干预 政策 时 ,需要 根据 时 间 因 素来 评估 风险 
并 判断 原因 的 效力 ), 我 们 都 不 能 忽略 事件 中 的 时 间 因 素 。 由 于 我 们 希望 
结果 紧 随 原因 之 后 出 现 ， 所 以 时 间 对 于 我 们 感知 事物 之 间 的 因果 关系 极 
为 重要 。 如 果 我 们 对 原因 导致 结果 的 过 程 ( 比如 吸烟 需要 很 久 才能 导致 
癌症 ) 有 所 了 解 ， 可 能 就 会 理解 原因 和 结果 之 间 的 时 间 间 隔 。 但 是 “ 原 
因 出 现在 结果 之 前 ”这 一 思想 对 于 我 们 考察 过 的 很 多 哲学 理论 来 说 都 至 
关 重 要 ， 并 且 这 一 思想 也 得 到 了 心理 学 实验 的 支持 。 


10.2.4 ”并 不 是 所 有 实验 研究 都 比 观察 性 研究 好 


是 采用 观察 性 研究 还 是 实验 研究 ， 这 个 问题 是 一 个 错误 的 两 分 法 。 
实际 上 , 我 们 不 可 能 在 每 一 种 情况 下 都 能 进行 实验 研究 ( 有 人 愿意 在 跳伞 
过 程 中 作为 对 照 组 去 研究 降落 伞 能 否 防止 死亡 事件 的 发 生 吗 ), 而 且 也 不 
总 是 需要 这 样 做 (物理 学 和 工程 学 再 加 上 一 些 模拟 , 这 就 可 以 代替 一 个 关 
于 降落 锌 的 RCT ) 更 重要 的 是 , 有 很 多 方法 可 能 会 导致 随机 试验 的 失败 ， 
而 且 在 有 些 情况 下 ， 我 们 也 可 以 通过 观察 来 了 解 事情 发 生 的 原因 。 

由 于 对 医学 研究 进展 缓慢 而 感到 诅 丧 ， 一 帮 患 有 肌 萎缩 侧 索 硬 化 证 
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(ALS) 的 病人 自己 设计 了 一 项 研究 ， 来 测试 一 种 实验 疗法 能 否 减 慢 他 们 
疾病 的 恶化 速度 。” 对 于 这 种 由 病人 领导 的 研究 来 说 ， 由 于 这 些 病 人 对 他 
们 的 健康 问题 积极 性 很 高 ， 所 以 他 们 所 面临 的 难题 就 是 如 何 设 置 对 照 组 。 
实际 上 ， 这 项 试验 研究 使 用 了 参与 者 和 来 自 社交 网 站 PatientsLikeMe ( 像 
我 一 样 的 病人 ) 的 其 他 病人 分 享 的 大 量 数据 。 在 医生 们 的 支持 下 ,实验 组 
在 他 们 的 治疗 方案 中 加 入 了 锂 ， 并 且 自 我 跟踪 研究 了 12 个 月 ， 详 细 记 录 
了 他 们 的 状况 。 

由 于 这 个 试验 不 是 盲 法 试验 ， 也 不 是 随机 试验 ， 所 以 这 项 研究 很 容 
易 出 现 很 多 偏差 。 为 了 解决 这 个 问题 , 每 一 个 病人 都 与 很 多 个 没有 服用 锂 
的 病人 搭配 在 一 起 进行 对 照 , 在 试验 开始 时 , 这 些 作 为 对 照 的 病人 与 参与 
实验 的 病人 病情 相似 。 在 接受 锂 治疗 后 , 通过 与 这 些 病 人 进行 对 照 ,参与 
实验 的 病人 可 以 看 出 他 们 和 对 照 病人 在 病情 上 是 否 有 差异 ,结果 没有 发 现 
任何 差异 。 这 一 负面 结论 在 随后 进行 的 多 次 随机 试验 中 得 到 了 证 实 。” 由 
于 很 多 因素 都 可 能 会 出 现 偏差 , 从 而 导致 结果 对 这 种 药物 有 利 , 所 以 从 某 
种 意义 上 来 说 ， 在 这 群 病人 中 得 出 的 负面 结论 比 在 一 次 RCT 中 得 出 的 结 
论 更 为 有 力 。 病 人 进行 的 不 是 盲 法 试验 ， 治 疗效 果 也 是 由 病人 自己 报告 
的 , 而 且 由 于 他 们 希望 这 个 药物 有 效 , 所 以 那些 认 知 偏差 完全 有 可 能 导致 
他 们 以 不 同 的 方式 来 评估 他 们 的 健康 状况 。 在 很 多 情况 下 , 将 实验 数据 和 
观察 数据 仔细 地 结合 在 一 起 可 以 解决 彼此 的 局 限 性 问题 。 此 外 , 当 这 两 个 
数据 得 出 的 结论 一 致 时 ， 会 增强 人 们 对 这 两 种 方法 的 信心 。 
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10.3 一 个 百宝箱 





如 果 你 只 有 一 把 锤子 ， 那 么 每 一 个 问题 都 像 是 一 根 钉子 。 我 们 之 所 
以 要 过 于 详细 地 讨论 每 一 种 方法 的 缺点 , 并 不 是 为 了 让 人 们 觉得 哪 一 种 方 
法 都 不 行 ， 而 是 想 要 说 明 没 有 哪 一 种 方法 是 万 能 的 。 概 率 模型 不 是 因果 推 
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理 的 唯一 方法 ， 反 事实 推理 法 也 不 是 解释 事件 的 只 








一 方法 。 很 多 方法 都 在 


以 人 们 意 想 不 到 的 方式 被 应 用 于 不 同 的 学 科 当 中 。 格 兰 杰 因 果 理 论 一 开始 














是 用 于 经 济 时 间 序 列 中 的 , 但 是 现在 已 经 被 用 来 分 析 神 经 元 放电 活动 记录 
了 。.“ 人 们 开发 贝 叶 斯 网 络 是 为 了 表示 概率 性 关系 ,但 它 现在 已 经 被 用 来 












































模拟 因果 推理 背后 的 心理 过 程 了 。 “没有 任何 方法 或 模型 是 放 之 四 海 皆 准 








的 ， 你 可 能 需要 超越 自己 的 研究 领域 来 寻找 问题 的 解决 方案 。 














如 果 这 个 解决 方案 有 标准 答案 ,那么 这 个 答案 就 是 我 们 需要 利用 多 
种 方法 。 每 一 种 方法 适用 于 一 种 不 同 的 情况 , 所 以 , 如 果 你 只 有 一 种 运用 








自如 的 工具 ,那么 你 会 由 于 这 个 工具 的 局 限 怕 

















大 部 分 情况 下 都 能 将 这 个 工具 改变 得 可 以 适用 于 各 




















E 而 挫败 不 已 。 只 要 付出 心血 ， 








种 情 


青 况 。 但 是 , 我 们 并 


不 是 要 你 用 胶带 和 铁 片 对 一 个 锤子 进行 改造 , 然后 用 它 来 翻动 煎饼 。 如 果 
你 知道 一 个 叫 铲子 的 东西 ， 那 么 你 就 可 以 省 去 很 多 麻烦 。 




















近 几 年 来 ， 人 们 越 来 越 意识 到 我 们 需要 的 是 一 纪 











能 够 互补 的 方法 ， 而 


不 是 一 种 能 够 解决 所 有 问题 的 方法 。” 比 如 ，Illari 和 Russo 最 近 提 出 了 关 
于 因果 关系 的 拼 贴 观 。 就 像 一 片 次 砖 在 一 幅 图 画 中 的 作用 不 能 仅 通 过 它 本 
身 来 理解 ,我 们 需要 使 用 的 方法 取决 于 问题 的 背景 、 意 义 、 眼 前 的 问题 和 












































我 们 的 目的 。 








这 是 因果 关系 多 元 化 趋势 的 一 部 分 ， 还 有 很 多 事物 都 可 以 被 多 元 化 。 
我 们 可 以 让 原因 的 定义 多 元 化 , ”让 支持 原因 的 证 据 多 元 化 ,还 可 以 让 收 
集 证 据 的 方法 多 元 化 。” 从 实际 出 发 , 我 们 通常 不 太 关心 因果 关系 在 形 而 
上 学 层面 的 研究 ,或 者 说 不 太 关 心 “ 原 因 究竟 是 什么 ”的 研究 。 但 是 , 前 
面 最 后 两 点 之 间 的 差别 还 是 值得 注意 的 。 人 们 可 能 会 认为 能 够 通过 多 种 特 



































征 来 将 因果 关系 和 相关 性 区 分 开 来 ， 比 如 通过 概率 法 、 干 预 法 和 机 械 法 都 





能 对 原因 有 所 了 解 。 但 是 , 在 这 些 方 法 中 间 ， 即 使 你 认为 干预 法 是 唯一 可 
以 支持 某 个 因果 假设 的 方法 ,用 来 收集 干预 法 所 需 证 据 的 方法 也 有 很 多 个 








(只 要 想 想 第 7 章 介绍 的 各 种 实验 法 就 能 明白 





了 )。 同 到 











,因果 关系 显著 性 

















的 测量 方法 也 有 很 多 ， 这 些 方法 强调 的 特征 也 各 不 相同 。 
针对 机 器 学 习 过 程 中 的 一 些 问题 ( 比如 优化 问题 )， 有 一 组 法 则 叫 作 



































“没有 免费 的 午餐 ”。” 就 是 说 如 果 一 个 方法 是 针对 某 一 种 
的 , 那么 这 种 方法 就 很 难 解决 其 他 类 型 的 问题 , 没有 任何 方法 能 够 完美 适 





























用 于 所 有 的 测试 。 这 就 意味 着 我 们 的 方法 不 可 能 完美 解决 所 有 问题 , 如 果 
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问题 设计 出 来 











一 种 方法 将 一 个 问题 解决 得 很 好 , 那么 它 在 男 一 个 问题 上 就 不 可 能 不 需要 


调整 。 这 看 起 来 可 能 很 麻烦 ,因为 如 果 我 们 耳 





不 知道 该 用 哪 一 种 方法 了 。 



































i 对 的 是 一 个 新 问题 , 我 们 就 





但 是 ， 我们 也 并 不 总 是 在 一 无 所 知 的 情况 下 挑战 一 个 新 问题 。 如 果 





我 们 对 手头 上 的 这 个 问题 已 经 有 所 了 解 , 也 知道 我 们 愿意 做 出 什么 样 的 让 
步 〈 比 如 接受 更 多 的 假 阴性 以 便 减 少 假 阳 性 结果 )， 那 么 我 
个 完美 适用 于 所 有 情况 的 方法 , 只 需 知道 如 何 针对 正在 解决 


选择 一 个 更 好 的 解决 方案 就 可 以 了 。 














们 并 不 需要 一 
的 某 个 问题 来 





比如 ， 如 果 我 们 想 考 察 在 某 个 城市 的 餐厅 内 公布 食物 热量 值 是 否 真 
的 会 降低 人 们 所 消费 食物 中 的 热量 值 , 这 就 是 一 个 关于 实体 因果 关系 的 问 
题 ， 它 更 适合 用 反 事 实 推理 法 来 解决 ， 而 不 是 格 兰 杰 的 因果 关系 理论 。 相 
反 , 假设 我 们 现在 有 来 自 计 步 器 和 联网 电子 秤 的 数据 , 也 知 
热量 值 。 在 这 种 情况 下 , 如果 我 们 想 根 据 人 们 的 锻炼 情况 和 











测 人 们 的 体重 , 那么 我 们 要 解决 的 问题 训 





























道人 们 摄 入 的 
饮食 习惯 来 预 











方法 也 会 与 上 面 的 案例 大 不 相同 。 对 于 这 个 问题 来 说 , 贝 叶 


一 个 很 好 的 选择 。 因 为 贝 叶 
某 个 变量 可 能 会 出 现 的 值 。 














斯 网 络 更 擅长 根据 网 络 中 其 他 变 








然而 , 如 果 我 们 想 知道 在 高 强度 























是 一 个 完全 不 同 的 问题 了 , 解决 





斯 网 络 可 能 是 
量 的 值 来 预测 
的 运动 之 后 需 














要 多 久 血 糖 才 会 升 高 , 选择 贝 叶 斯 网 络 就 不 是 什么 好 主意 了 , 我 们 应 该 选 





择 一 个 能 够 让 我 们 从 数据 中 发 现 某 种 关系 的 时 间 性 的 方法 。 























最 重要 的 是 ， 我 们 对 因果 关系 还 有 很 多 不 了 解 的 地 方 
于 改造 已 有 的 方法 ， 可 能 就 会 错过 很 多 重要 的 发 现 。 














。 如 果 只 局 限 
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10.4 知识 的 重要 性 


随 着 不 断 设计 出 更 好 的 方法 来 寻找 原因 并 预测 未 来 要 发 生 的 事件 ， 


果 关 系 简 易 入 门 





我 们 可 能 想 让 更 多 的 发 现 过 程 能 够 自动 化 , 并 慢 慢 将 人 从 这 一 过 程 中 和 剥离 
出 去 。 毕 竞 人 是 有 偏差 、 不 理性 且 无 法 预测 的 , 而 计算 机 程序 在 每 次 接受 
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的 每 一 步 都 离 不 开 人 的 知识 和 类 























样 的 指令 后 ,都 会 以 完全 相同 的 方式 忠实 地 执行 。 但 目前 来 讲 ,寻找 原 
1 靳 :决定 收集 什么 样 的 信息 、 准 备 数据 、 























选择 数据 分 析 方法 、 解 释 研究 结果 以 及 决定 如 何 根据 研究 结果 采取 行动 。 
我 们 曾经 想 要 找到 这 么 一 个 黑匣子 ， 让 它 能 在 没有 人 为 输入 的 情况 
下 ,， 百 发 百 中 地 将 “原始 ”数据 顺利 地 转化 成 原因 。 通 过 前 面 的 研究 ,我 






































们 已 经 知道 这 种 想法 错误 的 原因 是 什么 。 但 是 , 用 这 种 没有 人 为 判断 的 方 


式 来 使 用 原因 也 是 错误 的 。 如 果 一 个 公司 为 一 种 你 不 感 兴趣 的 产品 做 广 
告 , 或 者 一 个 网 站 推荐 了 一 部 你 不 喜欢 的 电影 ,这 些 错 误 的 成 本 很 低 。 但 
在 其 他 很 多 情况 下 ( 比如 Sally Clark 冤案 )， 误 用 因果 关系 可 能 会 带 来 严 
重 的 后 果 。 我 们 可 能 会 过 度 信任 一 个 推理 出 来 的 结论 , 或 者 某 种 计算 方法 
可 能 会 导致 我 们 过 度 依赖 一 般 性 的 常识 而 不 考虑 具体 情形 中 的 具体 细节 。 

医生 说 你 的 血压 太 高 ， 需 要 采取 一 些 措 施 。 这 时 ， 如 果 他 盲目 地 按 
照 一 套 指导 原则 来 给 你 开 处 方 , 你 肯定 不 愿意 ; 相反 , 你 希望 他 在 开 药 时 
能 考虑 一 下 你 当前 可 能 正在 服用 的 其 他 药物 ( 这 些 药物 有 可 能 会 与 降 压 药 


































































































相互 作用 )， 寺 
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且 和 希望 他 能 考虑 你 自己 的 治疗 重点 和 目标 。 根 据 治 疗 高 血 





压 的 一 般 性 指导 原则 , 医生 最 后 开 出 的 处 方 可 能 不 是 最 好 的 治疗 方案 , 但 
却 有 可 能 是 对 于 你 个 人 来 说 最 好 的 治疗 方案 。 因 为 尽管 高 血压 可 能 会 导致 














严重 的 健康 问题 , 但 是 降低 血压 并 不 是 你 的 唯一 目标 , 降低 血压 必须 和 其 









































他 目标 结合 在 一 起 来 考虑 。 你 可 能 正在 服用 一 些 药物 , 而 这 些 药物 会 与 指 




















导 原 则 推荐 的 降 压 药 产生 药物 反应 。 而 且 在 降 压 药 的 服药 次 数 上 ， 你 可 
能 更 容易 遵守 每 日 一 次 的 服药 要 求 ,而 不 是 每 日 多 次 的 服药 要 求 。” 也 有 
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可 能 由 于 医疗 保险 的 要 求 ,你 不 得 不 遵守 一 些 用 药方 面 的 限制 。 前 面 已 经 








Dial, 我 们 不 能 仅 根据 一 个 已 知 类 型 层面 的 关系 去 失 











yj 





理 一 个 实体 层面 的 
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; 同 理 ,我 们 也 不 应 该 只 使 用 类 型 层面 的 信息 去 做 关于 实体 案例 的 决策 。 














找到 原因 后 ， 当 我 们 在 考虑 如 何 使 用 原因 以 及 是 否 应 该 使 用 原因 时 ， 





我 们 需要 考虑 的 不 仅仅 是 关系 的 有 效 性 问题 。 











至 少 有 20 个 州 已 经 采 








在 美国 ， 


用 了 茶 种 形式 的 基于 证 据 的 刑事 量刑 


制度 。 这 一 制度 通过 计算 犯人 将 来 再 次 犯罪 的 风险 来 指导 量刑 。” 医学 领 
域 通 过 标准 化 进程 已 经 取得 了 很 大 的 进展 , 能 够 保证 根据 证 据 而 不 是 直觉 


去 为 病人 提 
图 为 人 们 提 


共 标 准 











制度 的 原则 和 目标 。 




















的 、 优 质 的 医疗 服务 。 基 于 证 据 的 刑事 量刑 制度 也 正 试 
共 一 个 更 加 公正 的 方式 来 确定 犯人 对 社会 的 威胁 , 并 减少 
法 宣 的 辨别 力 或 判断 力 不 同 而 可 能 导致 的 偏差 。 我 们 很 难 去 反对 这 一 量刑 


FE 


然而 ， 这 些 风 险 计算 器 考虑 了 很 多 与 犯人 的 犯罪 记录 无 关 的 其 他 特 

















一 个 儿 








一 个 人 生活 

















会 认为 他 再 

















征 ( 比如 经 济 状况 和 就 业 情况 ), 并 且 包括 了 一 些 个 人 无 法 控制 的 因素 ( 比 
如 性 别 )。 这 就 意味 着 如 果 两 个 人 犯 了 同样 的 罪 , 如 果 其 
E 率 比较 低 的 社区 , 或 者 如 果 他 有 一 份 稳定 的 工作 , 那么 人 们 可 能 
次 犯罪 的 可 能 性 比较 低 。 尽 管 这 些 因素 中 并 没有 直接 包含 种 族 


在 


因素 , 但 是 其 中 的 很 多 因素 都 和 种 族 因 素 相关 。 这 种 方法 和 犯人 有 没有 犯 





罪 记录 没有 任何 关系 ， 和 这 些 因 素 是 否 与 犯罪 行为 相关 也 没有 介 








F 何 关系 。 


相反 ， 这 种 方法 更 像 是 保险 公司 使 用 寿险 精算 表 来 给 保险 产品 定价 一 样 。 








一 个 人 的 预期 寿命 其 实 是 不 可 知 的 , 所 以 这 些 表格 根据 客户 所 





属 群体 
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如 年 龄 和 性 别 群体 ) 的 预期 寿命 来 计算 














具体 客户 的 预 








期 寿命 。 


先 不 要 管 不 同 的 刑期 是 否 真 的 会 让 犯人 再 次 犯罪 的 可 能 性 降低 ， 




















不 要 管 我 们 测量 的 (关于 各 种 特征 的 人 有 多 少 是 再 














次 犯案 的 犯人 ) 数据 


比 





fl & 
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TEM, “ 先 问 问 应 不 应 该 用 这 个 信息 来 决定 犯人 刑期 的 长 短 。 
一 个 原因 可 以 用 来 做 出 准确 的 预测 或 者 可 以 用 来 指导 人 们 的 决策 行 
为 并 不 意味 着 这 个 原因 应 该 被 用 来 做 这 样 的 事 。 因 果 推 理 方法 只 能 告诉 我 
们 某 些 群体 再 次 犯罪 的 概率 是 不 是 高 一 些 , 但 不 能 告诉 我 们 一 个 公正 的 社 
会 是 否 应 该 使 用 这 样 的 群体 特征 来 更 加 严厉 地 惩罚 某 些 罪犯 。 挖 握 大 型 数 
据 集 来 寻找 事物 相关 性 的 风险 之 一 就 是 我 们 不 知道 事情 为 什么 会 发 生 , R 
然 因果 推理 会 通过 客观 性 给 人 一 种 公正 的 表象 , 但 也 可 能 会 被 用 来 支持 一 
些 不 公正 的 、 带 有 此 视 性 的 行为 。 负 责任 地 使 用 原因 意味 着 我 们 不 仅 要 评 
佑 我 们 的 发 现在 统计 学 和 方法 论 上 的 合理 性 , 还 要 评 佑 这 些 发 现 的 后 果 和 
道德 基础 。 
我 们 需要 将 人 类 能 够 在 深思 熟 虑 的 基础 之 上 进行 判断 的 优势 和 计算 
机 能 够 以 一 种 人 类 无 法 企及 的 方式 对 海量 数据 进行 挖掘 的 优势 结合 在 一 
起 ， 而 不 是 让 所 有 事情 完全 自动 化 。 无 论 什 么 时 候 ， 只 要 我 们 面 对 一 种 可 
能 的 因果 关系 ， 都 必须 要 找到 能 够 支持 这 种 因果 关系 的 证 据 ， 同 时 还 要 
像 对 待 犯人 一 样 审问 它 : 我 们 的 证 据 仅仅 是 间接 证 据 吗 (就 像 相 关 性 一 
样 )， 还 是 背后 有 什么 动机 ( 为 什么 某 个 原因 会 导致 某 个 结果 的 一 个 机 械 
性 解释 )? 有 没有 什么 减轻 责任 的 因素 ( 比如 一 个 共同 原因 或 者 数据 中 的 
些 偏差 ) ? 随 着 与 我 们 的 发 现 有 关 的 成 本 和 风险 的 上 升 , 证 据 所 承担 的 
压力 也 必须 加 大 。 当 我 们 无 法 非常 自信 地 找到 原因 时 , 必须 勇于 将 这 种 不 
定性 说 出 来 ， 告 诉 人 们 我 们 确实 不 知道 原因 是 什么 一 一 然后 再 接着 找 。 


注释 


1. Chris Anderson 早 在 2008 年 就 在 《 连 线 》 杂 志 的 网 站 上 提出 了 观点 一 一 拍 
字 节 让 我 们 可 以 说 ,“ 有 相关 性 就 够 了 ”。( Anderson，2008 )。 

2. Russell ( 1912 )。 

3. 参见 第 3 章 关 于 多 重 对 比 的 讨论 。 
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4, 想 要 了 解 更 多 关于 影响 诊断 代码 准确 性 因素 的 信息 ， 参 见 0'Malley 等 
(2005 )。 
5. 想 要 了 解 更 多 根据 病历 记录 规律 来 区 分 慢性 病 和 急性 病 的 信息 ， 
Perotte 和 Hripcsak (2013 )。 
. Bond 等 (2012 )。 
. Ginsberg F (2009 )。 
. Lazer 等 (2014 )。 
.注意 ,意识 到 偏差 的 存在 并 不 意味 着 我 们 就 能 完全 避免 这 些 偏 差 。 想 要 从 非 
技术 层面 了 解 这 种 偏差 在 决策 过 程 中 的 表现 ， 参 见 Kahneman “ (2011 )。 
10. 想 要 了 解 一 些 例子 ， 参 见 Bareinboim 和 Pearl (2012 ); Robins 等 ( 2000 ); 
Spirtes 等 (1995 )。 

11. 想 要 了 解 更 多 方法 论 方面 考虑 的 问题 ， 参 见 Young 和 Karr (2011 )。 

12. Henning ( 1948 )。 

13. Mitofsky ( 1998 ); Sudman 和 Blair ( 1999 )。 

14. Wicks 等 (2011 )。 

15. 想 要 了 解 关 于 ALS 治疗 方案 研究 的 更 为 广泛 的 讨论 , 或 想 要 了 解 更 多 关于 

锂 治疗 方案 的 不 同 研究 ， 参 见 Mitsumoto 等 (2014 )。 

16. 事实 上 ， 在 为 数 不 多 的 、 包 含 多 变量 格 兰 杰 因果 关系 的 软件 包 中 ， 就 有 一 

个 软件 是 神经 学 家 开发 出 来 的 ( Barnett 和 Seth, 2014 )。 

17. 想 要 回顾 这 方面 的 研究 ， 参 见 Holyoak 和 Cheng (2011 )。 

18. 想 要 回顾 这 方面 的 研究 ， 参 见 Godfrey-Smith (2010 )。 

19. 这 就 叫 形而上学 的 多 元 论 (Psillos, 2010 )。 

20. Russo ( 2006 )。 

21. 想 要 一 个 简练 的 解释 ， 参 见 Ho 和 Pepyne ( 2002 ); 想 要 一 个 更 加 深入 的 解 
释 ， 参 见 Wolpert Ñ Macready ( 1997 ). 

22. 有 很 多 研究 考察 了 给 药方 案 和 人 们 遵守 这 一 方案 的 程度 之 间 的 联系 。 想 要 
回顾 这 方面 的 研究 ， 参 见 Claxton 等 (2001 )。 

23, 想 要 回顾 这 方面 的 内 容 ， 参 见 Slobogin (2012 ); 想 要 了 解 关于 问题 和 伦理 

的 讨论 ， 参 见 Sidhu ( 2015 ); Starr (2014 )。 

24. 我 们 试图 通过 对 逮捕 人 数 和 报案 次 数 进行 对 比 ， 来 证 实 这 些 方 法 是 有 效 

的 ， 但 这 仍然 不 能 告诉 我 们 实际 发 生 了 多 少 起 案件 ， 只 能 告诉 我 们 有 多 少 

人 被 捕 了 。 即 使 犯罪 活动 水 平 是 一 样 的 ， 有 些 社区 的 逮捕 率 也 可 能 会 高 于 

其 他 社区 。 
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